Теория игр представляет собой часть обширной теории, изучающей процессы принятия оптимальных решений. игры, т.е. будет равен 3. Если, однако, мы внезапно (для противника) сменим стратегию A1 на стратегию A2, то получим выигрыш 10.

Тема. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
Введение. Часть условий при разработке решения всегда неопределенна, поэтому практически все решения принимаются в условиях некоторой неопределенности. Но картина становится принципиально иной тогда, когда неопределенно большинство важнейших исходных данных.
"Неопределенными могут быть как условия выполнения операции, так и сознательные действия противников или других лиц, от которых зависит успех операции. Кроме того, неопределенность в той или другой степени может относиться также к целям (задачам) операции, успех которой не всегда может быть исчерпывающим образом охарактеризован одним единственным числом – показателем эффективности.
Разумеется, когда речь идет о неопределенности в каком-то смысле ситуации, то рекомендации, вытекающие из научного исследования, не могут быть столь же четкими и однозначными, как в случаях полной определенности. Однако и при отсутствии полной определенности количественный анализ ситуации все же может принести пользу и помочь при выборе решения. Разработаны специальные математические методы, предназначенные для обоснования решений в условиях неопределенности. В некоторых наиболее простых случаях эти методы дают возможность фактически найти и выбрать оптимальное решение.
В более сложных случаях эти методы доставляют вспомогательный материал, позволяющий глубже разобраться в сложной ситуации и оценить каждое из возможных решений с различных (иногда противоречивых) точек зрения, взвесить его преимущества и недостатки и, в конечном счете, принять решение, если не единственно правильное, то, по крайней мере, до конца продуманное.
Необходимо учитывать, что при выборе решения в условиях неопределенности всегда неизбежен элемент произвола, а значит, и риска. Недостаточность информации всегда опасна, и за нее приходится платить. Однако в условиях сложной ситуации всегда полезно представить варианты решения и их возможные последствия в такой форме, чтобы сделать произвол выбора менее грубым, а риск минимальным".
Как отмечалось, риск может быть снижен применением специальных приемов при разработке и принятии решений финансового менеджмента.
Задачами о принятии решений в условиях неопределенности занимает теория игр и теория статистических решений.






ТЕОРИЯ ИГР
Предмет и задачи теории игр
Подавляющее большинство социально-экономических решений приходится принимать с учетом противоречивых интересов, относящихся либо к различным лицам или организациям, либо к различным аспектам рассматриваемого явления, либо к тому и другому. В таких случаях невозможно применить традиционные методы оптимизации. В обычных экстремальных задачах речь идет о выборе решения одним лицом, и результат решения зависит от этого выбора, то есть определяется действиями только одного лица. В такую схему не укладываются ситуации, где решения, оптимальные для одной стороны, совсем не оптимальны для другой и результат решения зависит от всех конфликтующих сторон.
Конфликтный характер таких задач не предполагает вражды между участниками, а свидетельствует о различных интересах. Необходимость анализировать подобные ситуации вызвала к жизни специальный математический аппарат теорию игр.
Теория игр представляет собой часть обширной теории, изучающей процессы принятия оптимальных решений. Она дает формальный язык для описания процессов принятия сознательных, целенаправленных решений с участием одного или нескольких лиц в условиях неопределенности и конфликта, вызываемого столкновением интересов конфликтующих сторон.
Теория игр, раздел математики, изучающий формальные модели принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается явление, в котором участвуют различные стороны, наделённые различными интересами и возможностями выбирать доступные для них действия в соответствии с этими интересами. Отдельные математические вопросы, касающиеся конфликтов, рассматривались (начиная с 17 в.) многими учёными. Систематическая же математическая теория игр была детально разработана американскими учёными Дж. Нейманом и О. Моргенштерном (1944) как средство математического подхода к явлениям конкурентной экономики. В ходе своего развития теория игр переросла эти рамки и превратилась в общую математическую теорию конфликтов. В рамках теории игр в принципе поддаются математическому описанию военные и правовые конфликты, спортивные состязания, "салонные" игры, а также явления, связанные с биологической борьбой за существование.
В условиях конфликта стремление противника скрыть свои предстоящие действия порождает неопределённость. Наоборот, неопределённость при принятии решений (например, на основе недостаточных данных) можно интерпретировать как конфликт принимающего решения субъекта с природой. Поэтому И. т. рассматривается также как теория принятия оптимальных решений в условиях неопределённости. Она позволяет математизировать некоторые важные аспекты принятия решений в технике, сельском хозяйстве, медицине и социологии. Перспективен подход с позиций теории игр к проблемам управления, планирования и прогнозирования.

Целью теории игр является выработка рекомендаций по рациональному образу действий участников в конфликтных ситуациях, то есть определение оптимальной стратегии каждого из них.
Первые работы по теории игр (Цермело, Борель, фон Нейман) относятся к началу ХХ века. Но только появление и широкое распространение ЭВМ привлекло к теории игр внимание широкого круга специалистов.
Теория стратегических игр, в своей математической форме, возникла в 30-х годах XX века. Ее создателем считается Джон фон Нейман. Первой фундаментальной книгой по теории игр была изданная в 1944 году работа "Теория игр и экономическое поведение" (Нейман Д., Моргенштерн О. М.:Наука,1970).
Практическое значение теории игр состоит в том, что она служит основой моделирования игровых экспериментов, в частности, деловых игр, позволяющих определять оптимальное поведение в сложных ситуациях.
Примеры практического и в том числе экономического содержания призваны, скорее всего, содержательно интерпретировать математические положения теории игр, чем указывать на фактические или возможные их приложения. От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Реальные конфликты обычно трудно поддаются формальному описанию, поэтому любая игра является упрощением исходной задачи, в ней отражаются лишь основные, первостепенные факторы, отражающие суть процесса или явления.
В зависимости от того, какими данными располагает исследователь, и какую задачу перед собой ставит, могут быть сформулированы различные теоретико-игровые модели. Различают три основных типа задач:
1. Нахождение оптимального исхода. В качестве исхода в общем случае может рассматриваться социально-экономическая ситуация. В зависимости от содержания задачи ситуацию можно описать наборами благ, получаемых каждым игроком (выигрышами), или исходом может быть избрание того или иного кандидата, принятие того или иного проекта, договора и т.д. При этом в общем случае надо найти коалиционную структуру и коалиционные стратегии, при которых оптимальный исход реализуется.
2. Нахождение оптимального исхода при фиксированной коалиционной структуре, то есть когда нам заведомо известно, что, например, образование коалиций, запрещено, невозможно или имеющаяся коалиционная структура не должна меняться по каким-либо политическим или экономическим соображениям. В этом случае общей задачей является нахождение правил принятия решений в коалициях (порядок вознаграждения ее членов), при которых данная коалиционная структура не распадется, и, значит, система будет функционировать согласно интересам и возможностям ее участников.
3. Нахождение устойчивой коалиционной структуры при заданных правилах принятия решений (конституции, нормативных актах, уставе предприятия и др.) в коалициях. Такие задачи часто встречаются при решении экономических и социальных проблем.
Формализованные модели конфликтов известны с давних пор: это игры в буквальном смысле слова - шахматы, карты, кости и т.п. Эти игры носят характер соревнования, протекающего по известным правилам. Терминология, заимствованная из практики таких игр, применима и для других конфликтных ситуаций, которые рассматривает теория игр.
ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ
Задолго до появления теории игр широко использовали подобные упрощённые модели конфликтов – игры в буквальном смысле слова: шашки, шахматы, домино и т.д. Отсюда и название самой теории игр, и различные термины.
ИГРОЙ называется всякая конфликтная ситуация, изучаемая в теории игр и представляющая собой упрощенную, схематизированную модель ситуации. От реальной конфликтной ситуации игра отличается тем, что не включает второстепенные, несущественные для ситуации факторы и ведется по определенным правилам, которые в реальной ситуации могут нарушаться.
Всякая игра включает в себя три элемента: участников игры – игроков, правила игры, оценку результатов действий игроков.
Игроком (лицом, стороной, или коалицией) называется отдельная совокупность интересов, отстаиваемая в игре. Если данную совокупность интересов отстаивает несколько участников игры, то они рассматриваются как один игрок. Игроки, имеющие противоположные по отношению друг к другу интересы, называются противниками. В игре могут сталкиваться интересы двух или более противников. Одна реализация игры называется партией; выбор действия (в пределах правил) – ходом. Ходы бывают личные и случайные. Личный ход предполагает сознательный выбор того или иного действия, разрешенного правилами игры, а случайный – не зависит от воли игрока (например, он может быть определён подбрасыванием монеты или игральной кости и т.п.). Игры, в которых имеются личные ходы, называются стратегическими. Игры, состоящие только из случайных ходов, называют азартными. Характерный пример – игра в лото.
Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации.
В зависимости от числа стратегий игры делятся на "конечные" и "бесконечные". Игра называется конечной, если у каждого игрока имеется в распоряжении только конечное число стратегий. В противном случае игра называется бесконечной.
Оптимальной стратегией игрока называется такая, которая обеспечивает ему наилучшее положение в данной игре, т.е. максимальный выигрыш. Если игра повторяется неоднократно и содержит, кроме личных, ещё и случайные ходы, оптимальная стратегия обеспечивает максимальный средний выигрыш.
Игра называется игрой с нулевой суммой, если сумма выигрышей всех игроков равна нулю, т.е. каждый игрок выигрывает только за счёт других. Самый простой случай – парная игра с нулевой суммой – называется антагонистической. Теория антагонистических игр – наиболее развитый раздел теории игр, с чёткими рекомендациями.
АНТАГОНИСТИЧЕСКИЕ ИГРЫ
Опр. Антагонистической игрой называется система G=, где A,B - непустые множества стратегий соответственно первого и второго игроков; H(a,b) – функция выигрыша игрока A (то есть функция потерь игрока B), a(A, b(B.
Таким образом, в процессе игры каждый игрок выбирает свою стратегию, в результате чего образуется ситуация (a, b), которой соответствует выигрыш Н(a, b) для первого игрока и – Н(a, b) для второго.
Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы – стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.
Рассмотрим антагонистические игры более подробно. В этой игре, как было сказано выше, участвуют два игрока А и В, имеющих противоположные интересы: выигрыш одного равен проигрышу другого. Так как выигрыш игрока А равен выигрышу игрока В с обратным знаком, мы можем интересоваться только выигрышем игрока А. Естественно, А хочет максимизировать свой выигрыш, а В – минимизировать свой проигрыш. Пусть у игрока А имеется n возможных стратегий А1, А2, . . . ,Аn, а у противника – m – возможных стратегий В1, В2, . . ., Вm (такая игра называется игрой n(m). Обозначим аij выигрыш игрока А в случае, если мы пользуемся стратегией Аi, а противник – стратегией Вj. Предположим, что для каждой пары стратегий (Аi, Вj) выигрыш (или средний выигрыш) аij нам известен. Тогда в принципе можно составить прямоугольную таблицу (матрицу), в которой перечислены стратегии игроков и соответствующие выигрыши (см. таблицу 1).
Таблица 1. Платёжная матрица
B
A
В1
В2
. . .
Вm

А1
а11
а12

а1m

А2
а21


а2m

. . .





Аn
an1


аnm

Если такая таблица составлена, то говорят, что игра G приведена к матричной форме. Такая таблица называется платежной матрицей или просто матрицей игры. Отметим, что само по себе приведение игры к такой форме уже может составить трудную задачу, а иногда и практически не выполнимую, из-за необозримого множества стратегий. Заметим, что если игра приведена к матричной форме, то многоходовая игра фактически сведена к одноходовой – от игрока требуется сделать только один ход: выбрать стратегию. Будем кратко обозначать матрицу игры П=(аij). Если конечная игра записана в виде такой матрицы, то говорят, что она приведена к нормальной форме. Но попробуйте, например, записать и нормальной форме обыкновенные шахматы! Вы сразу столкнетесь с тем, что количество возможных стратегий необозримо велико настолько велико, что их перечисление выходит за пределы возможностей не только человека, но и современной вычислительной машины. А жаль! Потому что, если бы построение матрицы шахматной игры было возможно, это имело бы очень любопытные последствия... Но не будем забегать вперед.
Рассмотрим пример. Игроки А и В одновременно и независимо друг от друга записывает каждый одно из трёх чисел: 1, 2 или 3. Если сумма записанных чисел оказывается четной, то игрок В платит игроку А эту сумму; если же сумма чисел оказывается нечетной, то эту сумму выплачивает игрок А игроку В.
У игрока А три стратегии:
А1 – записать 1; А2 – записать 2; А3 – записать 3.
Стратегии игрока В аналогичны. Рассматриваемая игра есть игра 3(3. Платёжная матрица имеет три строки и три столбца. Эта матрица представлена таблицей 2.
Таблица 2. Исходная платёжная матрица
B
A
В1
В2
В3

А1
2
-3
4

А2
-3
4
-5

А3
4
-5
6

В таблице 2 одни элементы являются положительными, а другие отрицательными. Преобразуем полученную матрицу, прибавив к каждому её элементу значение 6. Преобразованная матрица представлена таблицей 3. С точки зрения анализа оптимальных стратегий эта матрица эквивалентна исходной.
Таблица 3 Преобразованная платёжная матрица
B
A
В1
В2
В3

А1
8
3
10

А2
3
10
1

А3
10
1
12

Принцип максимина
Естественный принцип оптимальности для антагонистической игры принцип максимина (минимакса). Будем анализировать эту игру, используя платёжную матрицу, показанную на табл. 3. Предположим, что игрок А выбирает стратегию А1. Тогда в зависимости от того, какую стратегию изберёт противник, наш выигрыш будет равен либо 8, либо 3, либо 10. Итак, выбирая стратегию А1, мы в худшем случае получаем выигрыш 3. Если же выберем стратегию А2 или А3, то будем иметь в худшем случае выигрыш 1. Запишем минимальные возможные выигрыши для разных стратегий Аi в виде дополнительного столбца платёжной матрицы (табл. 4). Ясно, что следует выбирать ту стратегию, где минимальный возможный выигрыш оказывается наибольшим (по сравнению с остальными стратегиями). В данном случае это стратегия А1. Выигрыш 3 является максимальным в тройке минимальных выигрышей (в тройке 3, 1, 1). Его называют максиминным выигрышем или, проще, максимином. У него ещё одно название – нижняя цена игры.
Табл. 4. Нижняя и верхняя цена игры
B
A
В1
В2
В3

·i

А1
8
3
10
3

А2
3
10
1
1

А3
10
1
12
1


·i
10
10
12


Аналогичным образом рассуждает противник. Если он выберет стратегию В1, то в худшем для себя случае позволит нам получить выигрыш 10. То же можно сказать и о стратегии В2. При выборе стратегии В3 худший (для противника) случай соответствует нашему выигрышу, равному 12. Числа 10, 10, 12 – максимальные значения наших выигрышей, отвечающие стратегиям противника В1, В2, В3 соответственно. Выпишем эти значения в виде дополнительной строки платёжной матрицы (см. табл. 4). Ясно, что противник должен выбрать ту стратегию, где наш выигрыш оказывается наименьшим. Это есть либо стратегия В1, либо В2. Обе стратегии являются минимаксными, обе они дают противнику гарантию, что наш выигрыш не превысит минимакса, или, иначе, верхней цены игры, равной в данном случае 10.
Верхняя и нижняя цены игры.
Величина
·
· называется нижней ценой игры.

Величина
·
· называется верхней ценой игры.

Наша максиминная стратегия, равно как и минимаксная стратегия противника, является наиболее осторожной, "перестраховочной" стратегией. Принцип осторожности, диктующий игрокам выбор таких стратегий, называют принципом минимакса.
Подведём итоги. Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы - стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.
Означает ли всё это, что теория игр рекомендует придерживаться только минимаксных (максиминных) стратегий? Ответ на этот вопрос зависит от того, имеет или не имеет платёжная матрица игры седловую точку.
Игра с седловой точкой
В [ Cкачайте файл, чтобы посмотреть ссылку ] седловая точка (седловой элемент) это наибольший элемент столбца [ Cкачайте файл, чтобы посмотреть ссылку ], который одновременно является наименьшим элементом соответствующей строки (в [ Cкачайте файл, чтобы посмотреть ссылку ]). В этой точке, следовательно, максимин одного игрока равен минимаксу другого; С. т. есть точка [ Cкачайте файл, чтобы посмотреть ссылку ].
Рассмотрим некоторую игру 3(3, платёжная матрица которой дана табл. 5. Здесь как максиминный, так и минимаксный выигрыши равны 4. Иными словами, в данной игре нижняя и верхняя цена игры совпадают, обе равны 4. Выигрыш 4 является одновременно и максимальным из минимальных выигрышей для стратегий А1, А2, А3 и минимальным из максимальных выигрышей для стратегий В1, В2, В3. В геометрии точку на поверхности, являющуюся одновременно минимумом по одной оси координат и максимумом по другой, называют седловой точкой (см. рис. 1). По аналогии с геометрией элемент а22=4 рассматриваемой здесь платёжной матрицы называют седловой точкой матрицы, а об игре говорят, что она имеет седловую точку.

Рис. 1. Пример поверхности с седловой точки
Достаточно посмотреть внимательно на матрицу (см. табл. 5), чтобы понять, что каждый из игроков должен придерживаться максиминной (минимаксной) стратегии. Эти стратегии являются оптимальными в игре с седловой точкой. Любое отклонение от них будет невыгодно для игрока, допустившего отклонение.
Если же игра не имеет седловой точки (см. табл. 4), то ни одна из стратегий Аi или Вi не является оптимальной.



Табл. 5. Платёжная матрица с седловой точкой
B
A
В1
В2
В3
Минимумы строк, (i

А1
2
3
7
2

А2
5
4
6
4

А3
6
2
1
1

Максимумы столбцов, (j
6
4
7


Как быть, если игра не имеет седловой точки? Если каждый игрок вынужден выбирать одну-единственную чистую стратегию, то делать нечего: надо руководствоваться принципом минимакса. Другое дело, если можно свои стратегии "смешивать", чередовать случайным образом с какими-то вероятностями. Применение смешанных стратегий мыслится таким образом: игра повторяется много раз; перед каждой партией игры, когда игроку предоставляется личный ход, он "передоверяет" свой выбор случайности, "бросает жребий", и берёт ту стратегию, которая выпала.
Смешанные стратегии в теории игр представляют модель изменчивой, гибкой тактики, когда ни один из игроков не знает, как поведёт себя противник в данной партии. Такая тактика (правда, обычно безо всяких математических обоснований) часто применяется в карточных играх.
Решение игр в смешанных стратегиях
Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. Так, в таблице 4, седловая точка отсутствует. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Необходимость случайного изменения стратегии в игре без седловой точки
Допустим, что мы и наш противник многократно играем в игру, матрица которой дана на рис. 4. Если мы выберем определённую стратегию, например максиминную стратегию A1, и будем придерживаться её от игры к игре, то противник, поняв это, будет выбирать каждый раз стратегию B2, в результате чего наш выигрыш не превысит нижней цены игры, т.е. будет равен 3. Если, однако, мы внезапно (для противника) сменим стратегию A1 на стратегию A2, то получим выигрыш 10. Разгадав нашу новую стратегию, противник тут же сменит стратегию B2 на стратегию B3, уменьшив наш выигрыш до 1. И так далее. Здесь проявляется общее правило для игр без седловой точки: игрок, играющий по определённой (детерминированной) стратегии, оказывается в более худшем положении по сравнению с игроком, который меняет стратегию случайным образом.
Впрочем, случайные изменения стратегии надо делать не как попало, а с умом. Пусть A1, A2, , An возможные стратегии игрока A. Для получения наибольшего эффекта он должен использовать все или некоторые из этих стратегий случайным образом, но не с одинаковыми, а с разными (специально вычисленными) вероятностями. Пусть стратегия A1,используется с вероятностью p1, стратегия A2,с вероятностью p2 и т. д.
Смешанной стратегией SA игрока А называется применение чистых стратегий A1, A2, ..., An с вероятностями p1, p2, ..., pi, ..., pn причем сумма вероятностей равна 1: 13 QUOTE 1415 Смешанные стратегии игрока А записываются в виде матрицы
13 QUOTE 1415,
или в виде строки SA=(p1, p2, , pn). В отличие от смешанных стратегий SA стратегии Aj называют чистыми. При надлежащем подборе вероятностей pj смешанная стратегия может оказаться оптимальной. При этом выигрыш игрока A будет не меньше некоторого значения v, называемого ценой игры. Это значение больше нижней цены игры, но меньше верхней.
Аналогичны образом должен вести себя игрок B. Его оптимальная стратегия также есть некоторая смешанная стратегия

или в виде строки SB=(q1, q2, ,qm), где qj специально подобранные вероятности, с которыми игрок B использует стратегии Bj. Сумма вероятностей равна 1:13 QUOTE 1415 При выборе игроком B оптимальной смешанной стратегии выигрыш игрока A будет не больше цены игры v.
Чистые стратегии можно считать частным случаем смешанных. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий S*A , S*B в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству
·
·v
·
·, где
· и
· нижняя и верхняя цены игры. Справедлива следующая основная теорема теории игр теорема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий. Пусть S*A = (p*1, p*2, ..., p*i, ..., p*m) и S*B = (q*1, q*2, ..., q*i, ..., q*n) пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.
Решением игры называется такая пара стратегий в общем случае смешанных, систематическое применение которых обеспечивает каждой стороне максимально возможный для нее по условиям игры выигрыш, определяемый ценой игры. Если же одна из сторон отступает от своей оптимальной стратегии (в то время как другая продолжает придерживаться своей), то это ни в коем случае не может быть выгодно для отступающего; это либо оставит его выигрыш неизменным, либо уменьшит. Таким образом, каждая конечная игра имеет решение (возможно, в области смешанных стратегий). Это положение называется основной теоремой теории игр.
Эта теорема имеет большое практическое значение она дает конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки.
Приведение матричной игры к задаче линейного программирования
Обозначим через SA=(p1, p2, , pn) оптимальную смешанную стратегию игрока A. Требуется найти вероятности и определить цену игры при условии, что известна платёжная матрица игры. Допустим, что игрок B выбирает чистую стратегию B1. Тогда средний выигрыш для игрока A будет равен a11p1+a21p2++an1pn. Этот выигрыш должен быть не меньше цены игры v, следовательно, a11p1+a21p2++an1pn
·v.
Если игрок B выберет стратегию B2, то и в этом случае средний выигрыш игрока A должен быть не меньше цены игры v, следовательно, a12p1+a22p2++an2pn
·v.
Какую бы стратегию ни выбирал игрок B, выигрыш игрока A всегда должен быть не меньше цены игры v. Поэтому мы можем записать следующую систему из m неравенств (напоминаем, что m число чистых стратегий игрока B):
a11p1+a21p2++an1pn
·v;
a12p1+a22p2++an2pn
·v;
(1)
a1mp1+a2mp2++anmpn
·v.
При этом p1+p2++pn=1. (2)
Введя обозначения x1=p1/v, x2=p2/v, xn=pn/v, перепишем (1) и (2) в виде
a11x1+a21x2++an1xn
·1;
a12x1+a22x2++an2xn
·1;
(3)
a1mx1+a2mx2++anmxn
·1;
x1+x2++xn=1/v. (4)
Нам желательно, чтобы цена игры была максимальной, следовательно, 1/v должна быть минимальной. Таким образом, поиск оптимальной смешанной стратегии свёлся к решению следующей задачи линейного программирования: надо найти неотрицательные величины xi такие, чтобы они удовлетворяли неравенствам (3) и обращали в минимум сумму x1+x2++xn, т.е.
L= x1+x2++xnmin,
при ограничениях
a11x1+a21x2++an1xn
·1;
a12x1+a22x2++an2xn
·1;

a1mx1+a2mx2++anmxn
·1;
xi
·0, i=1, 2, , n/
Задача. Самолёты против зениток. Найдём оптимальную смешанную стратегию некоторой конкретной игры. Предположим, что сторона A нападает на сторону B. У стороны A имеются два самолёта, несущие мощное поражающее средство. У стороны B имеются четыре зенитки, при помощи которых осуществляется оборона важного объекта. Чтобы объект оказался разрушенным, достаточно, чтобы к нему прорвался хотя бы один самолёт. Для подхода к объекту самолёты могут выбрать любой из четырёх воздушных коридоров (см. рис. 2).

Рис. 2. Воздушные коридоры и объект
У стороны A есть две чистые стратегии: стратегия A1 самолёты посылаются в разных воздушных коридорах (безразлично, каких именно), стратегия A2 оба самолёта посылаются в каком-то одном из коридоров. Возможные стратегии стороны B таковы: B1 поставить по зенитке на каждый коридор, B2 поставить по две зенитки на какие-то два коридора (остальные два коридора остаются неохраняемыми, B3 поставить две зенитки на один из коридоров и по одной зенитке ещё на два коридора, B4 поставить три зенитки на один из коридоров и одну зенитку ещё на один коридор, B5 поставить все четыре зенитки на один из коридоров. Стратегии B4 и B5 заведомо невыгодны хотя бы потому, что три, а тем более четыре зенитки в пределах одного коридора не нужны, ведь у стороны A всего два самолета. Поэтому ограничимся стратегиями B1, B2, B3.
Предположим, что сторона A выбрала стратегию A1, сторона B стратегию B1. Ясно, что тогда ни один самолёт не прорвётся к объекту выигрыш стороны есть нуль (a11=0). Пусть выбраны стратегии A1 и B2. В этой ситуации, какие бы два коридора ни выбирала сторона B для размещения пар зениток, у самолётов всегда будут шесть равновероятных вариантов и только один проигрышный. Таким образом, при выборе стратегий A1 и B2 вероятный выигрыш стороны A составляет 5/6 (a12=5/6). Рассуждая подобным образом, найдём остальные элементы платёжной матрицы данной игры (см. табл. 6). Нижняя цена игры равна Ѕ, верхняя ѕ. Седловой точки нет, оптимальное решение лежит в области смешанных стратегий.
Табл. 6. Платёжная матрица игры
B
A
В1
В2
В3
min

А1
0
5/6
1/2
0

А2
1
1/2
3/4
1/2

max
1
5/6
3/4


Чтобы найти оптимальную смешанную стратегию, воспользуемся платёжной матрицей (см. табл. 6) и соотношениями (3) и (4). В результате получим следующую задачу линейного программирования:
x1+x2min

13 QUOTE 1415, x1
·0, x2
·1
Решение удобно представить графически. Для этого построим область допустимых решений D (см. рис. 3). Уравнение x1+x2=const описывает семейство параллельных прямых, которые на рисунке показаны штриховыми линиями. Из всех прямых, имеющих хотя бы одну точку в пределах допустимой области, наименьшей сумме x1+x2 соответствует прямая FF. Точка G соответствует оптимальной смешанной стратегии. Координаты этой точки: x1=3/5; x2=1. Отсюда v=5/8, p1=3/8, p2=5/8. Итак, оптимальная смешанная стратегия стороны A предполагает использование стратегии A1 с вероятностью 3/8 и стратегии A2 с вероятностью 5/8.
Как воспользоваться этой рекомендацией на практике? Если игра происходит один раз, то стороне A следует, по-видимому, избрать стратегию A2, ведь p2>p1. Предположим, что игра совершается многократно (например, по отношению к многим объектам, подлежащим бомбардировке). Если игра повторяется раз N (N»1), то в 3N/8 случаях сторона A должна избрать стратегию A1, а в 5N/8 случаях стратегию A2.
Рассмотрим поведение стороны B. При выборе стороной A оптимальной смешанной стратегии её средний выигрыш оказывается в пределах между верхней ценой игры, раной ѕ, и ценой игры v=5/8. При неразумном поведении стороны B выигрыш стороны A может оказаться равным верхней цене игры (и даже может стать больше). Если сторона B, в свою очередь, будет придерживаться

Рис. 3. Допустимая область D (область красного цвета) и решение G.
оптимальной смешанной стратегии, то выигрыш игрока A окажется равным цене игры v. Оптимальная смешанная стратегия стороны B сводится к тому, что эта сторона вообще не применяет стратегию B3, стратегию B1 использует с вероятностью ј, а стратегию B2 с вероятностью ѕ. Нецелесообразность применения стратегии B3 усматривается из рисунка: соответствующая этой стратегии прямая EE не имеет общих точек с красной областью. Для определения вероятностей, с какими должны использоваться стратегии B1 и B2, воспользуемся уже найденным значением цены игры (v=5/8): q1(0+q2(5/6=5/8. Отсюда видно, что q1=1/4, q2=3/4. [Тарасов Л. В. Мир, построенный на вероятности. – М.: Просвещение, 1984. – 191 с.].
При решении произвольной конечной игры размера n Ч m рекомендуется придерживаться следующей схемы:
Исключить из платежной матрицы заведомо невыгодные стратегии по сравнению с другими стратегиями. Такими стратегиями для игрока А (игрока В) являются те, которым соответствуют строки (столбцы) с элементами, заведомо меньшими (большими) по сравнению с элементами других строк (столбцов).
Определить верхнюю и нижнюю цены игры и проверить, имеет ли игра седловую точку. Если седловая точка есть, то соответствующие ей стратегии игроков будут оптимальными, а цена совпадает с верхней (нижней) ценой.
Если седловая точка отсутствует, то решение следует искать в смешанных стратегиях. Для игр размера m Ч n рекомендуется симплексный метод, для игр размера 2Ч2, 2Чm, mЧ2 возможно геометрическое решение.
Фактическое решение некоторых классов антагонистических игр сводится к решению дифференциальных и интегральных уравнений, а матричных игр к решению стандартной задачи [ Cкачайте файл, чтобы посмотреть ссылку ]. Разрабатываются приближённые и численные методы решения игр. Для многих игр оптимальными оказываются так называемые смешанные стратегии, то есть стратегии, выбираемые случайно (например, по жребию).
Теория игр, созданная для математического решения задач экономического и социального происхождения, не может в целом сводиться к классическим математическим теориям, созданным для решения физических и технических задач. Однако в различных конкретных вопросах теория игр широко используются весьма разнообразные классические математические методы. Кроме этого, теория игр связана с рядом математических дисциплин внутренним образом. В теория игр. систематически и по существу употребляются понятия теории вероятностей. На языке теория игр можно сформулировать большинство задач математической статистики. Необходимость при анализе игры количественного учёта неопределённости предопределяет важность и тем самым связь И. т. с теорией информации и через её посредство с кибернетикой. Кроме того, теория игр, будучи теорией принятия решений, может рассматриваться как существенная составная часть математического аппарата [ Cкачайте файл, чтобы посмотреть ссылку ].
Теория игр применяется в экономике, технике, военном деле и даже в антропологии. Основные трудности практического применения теория игр связаны с экономической и социальной природой моделируемых ею явлений и недостаточным умением составлять такие модели на количественном уровне.
Принятие решений в условиях неопределенности. Элементы теории статистических решений
Предметом рассмотрения данного раздела служат статистические модели принятия решений, трактуемые как статистические игры или игры с Природой при использовании дополнительной статистической информации о её стратегиях. Характерная черта статистической игры – возможность получения информации в результате некоторого статистического эксперимента для оценки распределения вероятностей стратегий природы. Исследование механизма случайного выбора стратегии природой позволяет принять оптимальное решение, которое будет наилучшей стратегией в игре с неантагонистическим противником человека – природой.
В рассмотренных разделах теории игр предполагалось, что оба противника (или больше двух) активно противодействуют друг другу, что оба они достаточно умны, чтобы искать и найти свою оптимальную стратегию, и осторожны, чтобы не отступать от нее. Такое положение дает возможность предсказывать поведение игроков. Неопределенность была лишь в выборе противником конкретной чистой стратегии в каждой отдельной партии.
Но возможен случай, когда неопределенность в игре вызвана не сознательным противодействием противника, а незнанием условий, в которых будет приниматься решение, случайных обстоятельств. Такие игры называются "играми с природой".
Игра человека с природой тоже отражает конфликтную ситуацию, возникающую при столкновении интересов в выборе решения. Но "стихийным силам природы" нельзя приписать разумные действия, направленные против человека и тем более какой-либо "злой умысел". Таким образом, корректнее говорить о конфликтной ситуации, вызванной столкновением интересов человека и неопределенностью действий природы.
Действия природы могут, как наносить ущерб, так и приносить прибыль. Поведение природы можно оценить статистическими методами, определить присущие ей закономерности. В зависимости от степени знания этих закономерностей, определяющих поведение природы, различаются игры с природой в условиях определенности и игры с природой в условиях неопределенности.
Во-первых, поведение природы известно полностью (заданы вероятностями). Во-вторых - действия природы не известны, или изучены частично.
К явлениям природы, влияющим на результат решения, относят не только погодные и сезонные явления (дождь, засуху, урожай, неурожай), но и проявление любых, не зависящих от нас обстоятельств: например, задержки на транспорте.
Поиском решений в таких ситуациях и занимается теория статистических решений.
Человек, играя с природой, стремиться максимизировать свой выигрыш, поэтому, если он осторожный игрок (а теория игр рассматривает именно таких игроков), он должен при выборе своей стратегии руководствоваться тем, что неизвестные или известные ему закономерные действия природы приведут к наименее благоприятным последствиям. Именно поэтому такие игры можно рассматривать как игры двух лиц с нулевой суммой, которые были уже нами рассмотрены.
Формализация задачи происходит следующим образом: у активного игрока (человека) возможные действия по-прежнему называются стратегиями, а возможные действия пассивного игрока (природы) – состояниями или условиями природы.
В качестве первого игрока всегда выступает человек, поэтому в матрице записывается его выигрыш. Так как нас интересует оптимальная стратегия человека и его гарантированный выигрыш, то в игру достаточно определить максиминную стратегию первого игрока и нижнюю цену игры. Определение верхней цены игры имеет смысл, если данная игра повторяется многократно и оптимальная стратегия может быть смешанной.
Игры с природой в условиях неопределенности.
Если распределение вероятностей будущих состояний природы неизвестно, вся информация о природе сводится к перечню ее возможных состояний. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, например, покупательский спрос) действует случайно. Таким образом, в сложных структурах каждому допустимому варианту решений Xi вследствие различных внешних условий могут соответствовать различные внешние условия (состояния) Вj и результаты аij решений. Следующий пример иллюстрирует это положение.
Пусть из некоторого материала требуется изготовить изделие, долговечность которого при допустимых затратах невозможно определить. Нагрузки считаются известными. Требуется решить, какие размеры должно иметь изделие из данного материала [Э. Мушик, П. Мюллер. Методы принятия технических решений. М.: Мир, 1990. – 2008 с.].
Варианты решений таковы:
X1 – выбор размеров из соображений максимальной долговечности, т.е. изготовление изделия с минимальными затратами в предположении, что материал будет сохранять свои характеристики в течение длительного времени;
Xn – выбор размеров в предположении минимальной долговечности;
Xi – промежуточные решения.
Условия (состояния), требующие рассмотрения, таковы:
В1 – условия, обеспечивающие максимальную долговечность;
Вm – условия, обеспечивающие минимальную долговечность;
Вj – промежуточные условия.
Под результатом решения аij здесь можно понимать оценку, соответствующую варианту Xi и условиям Вj и характеризующую экономический эффект (прибыль), полезность или надёжность изделия. Семейство решений описывается некоторой матрицей n
·m, которую называют матрицей решений (условия игры задаются матрицей n
·m). По аналогии с теорией игр, эту матрицу будем называть также платёжной матрицей.
Таблица. 7 Матрица решений (n(m
Условия
Варианты
B1
B2
B3

Bj

Bm

X1
a11
a12
a13

a1j

a1m

X2
a21
a22
a23

a2j

a2m

X3
a31
a32
a33

a3j

a3m










Xi
ai1
ai2
ai3

aij

aim










Xn
am1
am2
am3

anj

anm

Конструктор старается выбрать решение с наилучшим результатом, но, так как ему неизвестно, с какими условиями он столкнётся, он вынужден принимать во внимание все оценки аij, соответствующие варианту Xi.
Оценочная функция
Чтобы прийти к однозначному и по возможности наивыгоднейшему варианту решений даже в том случае, когда каким-то вариантам решений Xi могут соответствовать различные условия Вj, можно ввести подходящие оценочные (целевые) функции. При этом матрица решений сводится к одному столбцу. Каждому варианту Xi приписывается, таким образом, некоторый результат аir, характеризующий, в целом, все последствия этого решения. Такой результат мы в дальнейшем будем обозначать тем же символом аir.
Рассмотрим некоторые оценочные функции, которые в данном примере мог бы выбрать конструктор.
Оптимистическая позиция:
13 EMBED Equation.3 1415 (1)
Из матрицы результатов решений выбирается вариант (строка), содержащий в качестве возможного следствия наибольший из всех возможных результатов. Наш конструктор становится на точку зрения азартного игрока. Он делает ставку на то, что выпадет наивыгоднейший случай, и, исходя из этого, выбирает размеры изделия.
Позиция нейтралитета:
13 EMBED Equation.3 1415 (2)
Конструктор исходит из того, что все встречающиеся отклонения результата решения от "среднего" случая допустимы, и выбирает размеры, оптимальные с этой точки зрения.
Имеется ряд критериев, которые используются при выборе оптимальной стратегии. Рассмотрим некоторые из них.
Особые случаи
Схематическое сопоставление всех возможных полезностей aij различных решений в матрице табл. 2 облегчает поначалу их обозрение, не требуя при этом формальной оценки. Эта матрица может быть меньшего объёма (табл.8) и даже выродиться в единственный столбец, если будет представлена полная информация о том, с каким внешним состоянием Вj следует считаться. Это соответствует элементарному сравнению различных технических решений. Матрица решений может, однако, свестись и к единственной строке (см. табл.9). В этом случае мы имеем дело с так называемой фатальной ситуацией принятия решений, когда в силу ограничений технического характера, внешних условий и других причин остаётся единственный вариант, хотя его дальнейшие последствия зависят от внешнего состояния Вj, и поэтому результат решения оказывается неизвестным [Мушик Э., Мюллер П. Методы технических решения: Пер. с нем. – М.: Мир, 1990. – 208 с., ил.].
Таблица. 8. Матрица решений (n(2)
Условия
Варианты
B1
B2

X1
a11
a12

X2
a21
a22

X3







Xi
ai1
ai2





Xn
an1
an2

Таблица.9. Фатальная ситуация в принятии решений
Условия
Варианты
B1
B2
B3

Bj

Bm

X1
a11
a12
a13

a1j

a1n

Случается и так, что некоторый вариант решения, например, оказывается настолько удачным, что для другого варианта Xl из матрицы выполняются неравенства akj
·alj для j=1, , n. Тогда говорят, что решение Xk доминирует над решением. Решение Xk в этом случае с самого начала оказывается лучшим, а вариант Xl, напротив, с самого начала не представляет далее интереса.
Классические критерии принятия решений
Максиминный критерий Вальда. Согласно этому критерию игра с природой ведётся как игра с разумным, причём агрессивным противником, делающим всё для того, чтобы помешать нам достигнуть успеха. Оптимальной считается стратегия, при которой гарантируется выигрыш не меньший, чем "нижняя цена игры с природой":

·=13 EMBED Equation.3 1415 (3)
Правило выбора решения в соответствии с критерием Вальда (максиминным критерием):
Правило выбора в соответствии критерием Вальда. Матрица решений (платёжная матрица) дополняется ещё одним столбцом из наименьших результатов аir каждой строки. Выбрать надлежит те варианты, в строках которых стоят наибольшие значения аir этого столбца.
Выбранные таким образом варианты полностью исключают риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Какие бы условия ни встретились, соответствующий результат не может оказаться ниже ZMM. Это свойство заставляет считать максиминный критерий одним из фундаментальных. Поэтому в технических задачах он применяется чаще всего, как сознательно, так и неосознанно. Однако положение об отсутствии риска стоит различных потерь. Продемонстрируем критерий Вальда на примере (см. таблицу 10).
Таблица 10. Пример вариантов решения без учёта риска
B
X
В1
В2
В3
аir
13 EMBED Equation.3 1415

X1
1
10
1
1


X2
1.1
1.1
1.2
1.1
1.1

Выбирая вариант X2, предписываемый критерием Вальда, мы избегаем неудачного значения 1, реализующего в варианте X1 при внешнем состоянии B1, получая вместо него при этом состоянии немного лучший результат 1.1, зато в состоянии В2 теряем выигрыш 10, получая всего только 1.1. Это пример показывает, что в многочисленных практических ситуациях пессимизм минимаксного критерия может оказаться невыгодным
Применение критерия Вальда бывает оправдано, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:
о возможности появления внешних состояний Вj ничего не известно;
приходится считаться с появлением различных внешних состояний Вj;
решение реализуется лишь один раз;
необходимо исключить какой бы то ни было риск, т.е. ни при каких условиях Вj не допускается получать результат, меньший, чем ZMM.
Критерий пессимизма-оптимизма Гурвица.
Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей, т.е. стараясь занять уравновешенную позицию, Гурвиц предложил критерий (HW), оценочная функция которого находится где-то между точками предельного оптимизма и крайнего пессимизма. Оценочная функция имеет две формы записи:
ZHW =13 EMBED Equation.3 1415, (5)
где ( “степень пессимизма” ("коэффициент пессимизма", весовой множитель), 0( ( (1.
Правило выбора согласно критерию Гурвица (HW – критерия) формулируется следующим образом:
Матрица решений дополняется столбцом, содержащим средние взвешенные наименьшего и наибольшего результатов каждой строки. Выбираются те варианты Xi, в строках которых стоят наибольшие элементы air этого столбца.
При (=1 критерий Гурвица (5) тождественен критерию Вальда, а при ( =0 – в критерий крайнего оптимизма (критерий азартного игрока), рекомендующий выбрать ту стратегию, при которой самый большой выигрыш в строке максимален. В технических приложениях правильно выбрать этот множитель бывает так же трудно, как и выбрать критерий. Вряд ли возможно найти количественную характеристику для тех долей оптимизма и пессимизма, которые присутствуют при принятии решения. Поэтому чаще всего весовой множитель (=0.5 без возражений принимается в качестве некоторой "средней" точки зрения.
На выбор значения степени пессимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень

Приложенные файлы

  • doc 1396721
    Размер файла: 2 MB Загрузок: 0

Добавить комментарий