<<
>>

14.3. МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ ИГРЫ; ЧИСТЫЕ И СМЕШАННЫЕ СТРАТЕГИИ

Если игра с платежной матрицей А== [ars] (г = 1, 2,..., т\ s = 1, 2,..., п) играется один раз, то ars — это выплата игроку А в соответствии с выбранными игроками стратегиями. Если игра играется большое число раз (N), то определим Е как среднюю сумму выплат игроку А или математическое ожидание игры1.
Тогда величина Е зависит от системы стратегий, выбираемых игроками в следующих одна за другой партиях. Общая цель игрока А при повторении партий состоит в таком выборе своих стратегий, чтобы сделать Е как можно больше. Напротив, целью В является сколь возможно уменьшить величину Е путем выбора системы своих стратегий. При выборе стратегий каждый игрок должен принимать в расчет действия своего противника настолько, насколько он может это сделать. Конечно, никакой игрок не может непосредственно влиять на выбор другого игрока.

Игрок А следует чистой стратегии в повторяющихся партиях, если в каждой партии он выбирает из всех доступных для него альтернатив одну и ту же стратегию. Если оба игрока следуют чистым стратегиям, то любая партия такова же, как и всякая другая. В каждой партии А следует своей г-й стратегии, В применяет свою 5-ю стратегию, и платеж для А равен ar Следовательно, ожидание Е также равно ars, и оно мажет быть понимаемо, как функция двух переменных, каждое из которых принимает только целые значения:

E(r, s) = ar, (r= 1, 2, ira; s=l, '2, ..., п).

Игрок А выбирает г с целью сделать Е как можно больше, после принятия во внимание возможных выборов s игроком В. Таким же образом, В выбира'ет s и пробует учесть выбор г со стороны А для того, чтобы сделать Е возможно меньше. Вопрос состоит в том, возможно ли так одновременно выбрать г и 5, чтобы они были для каждого игрока оптимальны (устойчивы) с точки зрения минимаксного принципа и совместны и чтобы каждый игрок выбцрал бы именно ту стратегию, которая для него предсказана в своих рассуждениях другим игроком.

Если дело обстоит так, то игра имеет решение в чистых стратегиях. Будет показано, что это имеет место только в специальных случаях. Однако, даже если существуют такие стратегии г и s, такое решение не представляет особого интереса, так как игра, в которой результат и течение каждой партии совершенно идентичны, будет скучна.

Более сложный вопрос относится к игре, в которой каждый игрок принимает в последовательных партиях различные стратегии. Мы говорим,

1 Строгое определение величины Е как математического ожидания выигрыша для игрока предполагает употребление понятия «вероятность». Аллен везде говорит просто об «ожидании» (expectation) и только в редких случаях употребляет термин «математическое ожидание», но без связи с понятием вероятности. В тексте мы переводим «expectation» через «математическое ожидание».— Прим. ред.

что игрок следует смешанной стратегии, если он меняет выбор стратегии от одной партии к другой, согласно некоторой системе. Эта «система» («pattern») понимается не как особая последовательность стратегий, выбираемых в партиях в этом порядке, это скорее случайный порядок выбора стратегий в заданных пропорциях. Например, если «система» предписывает игроку применять первую стратегию в одном из десяти случаев, то из этого следует, что в среднем первая стратегия должна' выбираться в одной десятой части сыгранных партий, но вовсе не означает, что в каждой десятой партии применяется первая стратегия. Математическое ожидание Е тогда усложняется, и оно зависит от того, какие стратегии комбинируются или «смешиваются» игроками. Задать Е как функцию от двух переменных возможно только в простейшем случае игры с двумя стратегиями для каждого игрока. Этот случай заслуживает детального рассмотрения до того, как будет рассмотрен общий случай (см. 14.7).

Пусть каждый игрок имеет две стратегии (г, $ = 1, 2), и платежная матрица будет второго порядка:

Г аг1 а12~

А =

_а 21 а22 _

Оба игрока придерживаются смешанной стратегии, и свои стратегии они выбирают с разной вероятностью (относительной частотой).

Пусть игрок А выбирает стратегию 1 с вероятностью х; следовательно, стратегия 2 будет выбираться им с вероятностью (1 — х). Пусть вероятность выбора игроком В своих стратегий будет соответственно у и (1 — у). Мы предполагаем, что между выборами стратегий в каждой партии игроками А її В нет никакой взаимосвязи. Тогда в длительной серии из N партий четыре комбинации пар стратегий встретятся с численностями, которые можно представить следующей матрицей81:

Г xyN x(i—y)N

|_(1 -x)yN (1-*)(1 -y)N_ *

Следовательно, в xyN партиях из N партий платеж равен а1г и так далее для остальных пар стратегий. Средний платеж, получаемый игроком А в результате партии, или математическое ожидание игры тогда будет:

Е (х, у) = апху + а12х (1 -у) + а21 (1 - х) у + а22 (1 - х) (1 - у). (1)

Он является функцией от двух переменных х її г/, каждое из которых может принимать значение от 0 до 1, то есть 0<я, у<1. Уравнение (1) можно записать и в таком виде:

Е (х, у) = (ап — а12 — а21 + а22) ху — (а22 — а12) х — (а22 - а21) у + а22.

Когда ап — а12 — а21 +а22 Ф 0, то можно записать Е(х, у) = а(х-а)(у-ф) + Ъ,

где

а = ап — а12 — а21 + а22 Ф О а117~~а12 — а21 ~Ьа22 а22 — 021 аи — а12 «21+й22 й22- — «12 а11 — а12 — «21+ «22 '

Это обычная квадратичная (гиперболическая) функция. Когда — я12 — — а214-а22 = 0, функция Е(х, у) превращается даже в еще более простую, линейную форму:

Е (х, у) = а22 — (а22 — а12) а; — (а22 — а21) г/. (3)

Пример (а).

Пусть А = ? J J J , тогда

У) = — ху+х(\ — г/)+(1— х)у — (1— *)(1 — у) =

С'Ч)-

Пример (б).

Пусть А=[з ' Т0ГДа Е{х' = — 4 5/4> (2/--3/4) + 7/4-

Пример (в).

Пусть А= 2 J 1 тогда Е(х> У) = х~% + 2-

Величина Е нами определена как средняя величина платежа, полученного игроком А на протяжении большого числа партий рассматриваемой игры. Для игрока А она является математическим ожиданием выигрыша в каждой отдельной партии. В качестве иллюстрации к такому истолкованию величины Е рассмотрим игры на скачках, приведенные в примере (г) раздела 14.2.

Здесь

Чі 1 Если игрок А ставит 1 фупт на первую лошадь с относительной частотой х в большом числе скачек, и если первая лошадь выигрывает скачку с относительной частотой ?/, тогда среднее значение выигрыша для игрока А будет:

Е(х. = ~ ху—х (1 — у) — у (1 — я)-f-2 (1 — я) (1 — у) = ~ (^х—(^jy—.

Предположим, что рассматривается только одна скачка, и вероятность на выигрыш у первой лошади оценивается числом у. Пусть игрок А делит свой 1 фунт, ставя х на первую лошадь и (1—х) на вторую. Тогда его ожидание выигрыша выражается той же величиной Е(х, у).

Задачи и упражнения. 1.

Написать Е(х, у) для игры с платежной матрицей ^ .

Чем отличается эта игра и ее математическое ожидание от игры примера (а) этого раздела? 2.

Составить платежную матрицу второго порядка, для которой Е (х, у) — — а (#+<х) где параметры а, а и р положительны. Показать, что аХ1 должно быть больше, чем другие три элемента этсщ матрицы. 3.

Показать, что элементами платежной матрицы второго порядка являются Е( 1, 1), Е( 1, 0), Е(0, 1) и Е(0, 0). Для случая, рассмотренного в предыдущем упражнении, показать что условие Ъ > 0 определяет игру, в которой А всегда выигрывает вне зависимости от действий В. 4.

В задаче о скачках (пример (г)) рассмотреть незначительно измененную платеж

ную матрицу

[М-

—1 1 |

Каковы в этом случае условия ставок? Написать функцию Е(х, у) и объяснить, в каком смысле верно, что в этом случае букмекер обычно выигрывает. 5.

В примере (д) в разделе 14.2 предположить, что вопрос о страховании мехового пальто встает на протяжении ряда периодов N. А страхует пальто в х N случаях, а вероятность гибели от огня для каждого периода равна у. Показать, что средний убыток для А будет:

Е(х, у)=х-{- 100г/ — ІООху.

Каков будет убыток, если А страхует в каждом периоде и если А совсем не страхует? Какова должна быть вероятность пожара, чтобы убыток в обоих случаях был одинаков? Объяснить результат. 6.

Игра имеет платежную матрицу 2 X п. Показать, что математическое ожидание Е в том случае, когда А смешивает свои стратегии, а игрок В играет согласно своей чистой стратегии, можно записать в виде Е(х, s), где 0 < х < 1 и s = 1, 2,..., п. Выразить Е через элементы платежной матрицы и проиллюстрировать на материале примера (ж) в разделе 14.2.

<< | >>
Источник: Р. Аллен. МАТЕМАТИЧЕСКАЯ ЭКОНОМИЯ. 1963

Еще по теме 14.3. МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ ИГРЫ; ЧИСТЫЕ И СМЕШАННЫЕ СТРАТЕГИИ:

  1. Вычисление математического ожидания
  2. ТЕМА ИГРЫ: «ПРАВА НЕСОВЕРШЕННОЛЕТНИХ» ЦЕЛИ ИГРЫ:
  3. Осипова Е.. Конфликты и методы их преодоления: социально-психологический тренинг М.: Чистые пруды. - 32 с., 2007
  4. НАПРЯЖЕННОЕ ОЖИДАНИЕ
  5. Высказывания ожиданий
  6.    В ожидании врага
  7. В ОЖИДАНИИ НОВОГО НАПОЛЕОНА
  8. 1.2. Формирование и поддержание повышенных ожиданий
  9. Ожидание мертвецов и ритуальная инициация
  10. §4. Смешанные методы
  11. 1. Смешанные, или комбинированные, уроки