<<
>>

14.2. ИГРА ДВУХ УЧАСТНИКОВ С НУЛЕВОЙ СУММОЙ И ЕЕ ПЛАТЕЖНАЯ МАТРИЦА

Игры, рассматриваемые теорией игр, могут включать элемент случайности, но, в основном, они являются играми мастерства, в которых стратегии (то есть выбор способа действия) являются их частью. Практически в эту группу попадают и простые игры и очень сложные.
В качестве известных в обиходе примеров можно привести игру «крестики и нолики», шахматы и бридж.

Предварительно необходимо сформулировать некоторые определения и отличительные особенности.

Игра — это совокупность правил и процедур, относящихся к партии, которым подчиняются ее участники. Партией называется конкретная реализация игры, практическое применение правил, приводящее к определенному результату.

Ход — момент в игре, когда один из партнеров встречается с альтернативами79, выбор — вариант, действительно избранный в партии. Платежи делаются по окончании каждой партии в соответствии с ее исходом, причем безразлично, выражаются ли «платежи» в денежной сумме или подсчитывают- ся набранные в партии очки или фишки. Если в игре участвует больше двух игроков, то возможны платежи каждого из них любому другому игроку. Простая иллюстрация этих положений дается далее в упражнении 1 к этому разделу.

Здесь мы рассматриваем лишь такие игры, в которых участвуют только два игрока, А и В, причем выигрыш одного партнера равен проигрышу другого и, следовательно, сумма платежей всегда равна нулю. В результате партии такой игры двух лиц с нулевой суммой игрок А получает чистую сумму а от игрока В, а игрок В получает чистую сумму Ь=—а от игрока А. Здесь а может быть положительно (А выиграл) или отрицательно (В выиграл). В действительности происходит только одна передача — платеж от А к В или наоборот. Такой тип игры имеет более общий характер, чем это может показаться на первый взгляд. Например, бридж является игрой двух лиц с нулевой суммой. Хотя имеется четыре партнера, но они играют попарно, то есть имеется два «игрока», где под каждым из них нужно понимать команду из двух участников.

Более того, игры двух лиц с нулевой суммой бесконечно разнообразны. Число ходов может меняться от одного до любого конечного числа или может быть бесконечным, равно как и число возможных при каждом ходе вариантов. Объем информации (например, знание при каждом ходе о выборе противника, сделанном при предыдущих ходах), имеющейся в распоряжении каждого игрока, может различаться. В большей или меньшей степени в игру могут входить элементы случая. Например, сдача карт или подбрасывание монеты устанавливают, какой игрок делает первый ход. Общим для игры двух лиц с нулевой суммой является наличие конфликта интересов между двумя игрокам и тот факт, что в конечном счете то, что теряет один, выигрывает другой игрок.

Игра, состоящая из нескольких ходов, может быть названа развернутой или экстенсивной игрой (extensive game). Может случиться, что игра имеет конечное число ходов и конечное число вариантов при^каждом ходе. В таком случае игра конечна, и все доступные игрокам «стратегии» могут быть перечислены. Однако это вовсе необязательно: существуют игры, в которых число ходов неограниченно и число «стратегий» бесконечно. Настоящее изложение, фактически, охватывает конечные игры; хотя они и важны, но не только эти игры представляют интерес.

Теория игр тесно связана с теорией выпуклых множеств (см.

11.5). В общих чертах здесь создается следующая ситуация. Если мы нашли, согласно минимаксному принципу, некоторое число решений игры, то их выпуклая оболочка представляет собой бесконечное множество решений игры. Задача заключается в нахождении полного выпуклого множества решений. Литература по математической теории игр приведена в конце книги, в библиографии к настоящей главе.

Цель этой главы состоит в том, чтобы дать более простое изложение главных результатов теории игр. Лучшими введениями в теорию игр являются книги Мак-Кинси [6] и Кемени, Снелла и Томпсона [1J. В популярной и увлекательной форме изложены первоначальные сведения по теории игр в работе Вильямса [И]. В книге Льюса и Райфа [4], кроме игр двух лиц с нулевой суммой, рассмотрены игры и многих других типов. Во всех этих работах внимание больше обращено на изложение концепций и методов, чем на математические детали.

Будем рассматривать конечную игру, то есть игру с конечным числом ходов и конечным числом альтернатив при каждом ходе. Тогда, можно сказать, что у игрока А есть выбор из т стратегий в партии, и эти стратегии могут быть перенумерованы числами от 1 до т (г — 1, 2, ..., т). Таким же образом, у В имеется выбор из п стратегий (s = 1, 2, ..., п). Когда игроки А и В выберут свои стратегии, то вся партия игры автоматически определится по правилам игры. Каждая стратегия должна составить план, в соответствии с которым при каждом ходе и при каждой возможной совокупности обстоятельств игрок делает свой выбор. Число различных стратегий типу игроков может быть очень велико, и на практике оно обычно бывает велико, но конечно. Поэтому всегда возможно перечислить стратегии для каждого игрока.

Когда в игре имеется только два хода (по одному для каждого партнера), перечисление стратегий довольно просто. При своем ходе А имеет для выбора конечное число альтернатив; занумеруем их числами г = 1,2, ..., /тг. В свою очередь, В имеет конечное множество альтернатив для выбора, перенумерованных числами s = 1, 2, ..., п. Как только А и В выбрали свои номера стратегий г и 5, партия игры определится. Однако, как это будет ясно из упражнения (ж) настоящего раздела, перечисление стратегий для игроков А и В (т для Ann для Б), может быть сделано независимо от того, какое может быть (конечное) число ходов. В любой игре возможны затруднения при практическом перечислении всех различных стратегий; но возникающие здесь трудности чисто практического, а не теоретического характера.

Пусть игра будет сыграна при стратегии с номером г, выбранной игроком А, и стратегии s, выбранной игроком В. Партия в таком случае определена, и в результате ее будет произведен соответствующий платеж. Пусть ars обозначает сумму, полученную А от В. Здесь ars определено для любых г и s и может быть положительным, отрицательным или равным 0. Всего имеется т X п различных способов разыграть партию, и для каждого из них — определенный платеж ars (г =•? 1,2, ..., т; s = 1,2, ..., п).

Эти суммы можно записать в виде платежной матрицы для игрока А: - «11 «12 • • • «Ш " А = Ks] = «21 «22 • • • «2/1 aml «тп2 • • • «тп Имеется также платежная матрица для игрока В: В = [6rs], где brs =. = —ars. Нет необходимости рассматривать ее самостоятельно, так как В=—А.

Легко объяснить строение платежной матрицы. Каждая строка элементов отображает выбор стратегии игроком А. Всего в матрице имеется т строк, по одной для каждой стратегии А, и аналогично п столбцов, по одному столбцу для каждой стратегии игрока В. Когда игроки А и В выбирают свои стратегии, то тем самым определяются одна строка и один столбец в матрице А, и элемент ars на их пересечении представляет собой сумму, полученную игроком А в результате партии, проведенной согласно выбранным стратегиям.

Пример (а).

Рассматривается игра с двумя ходами, в которой каждый из игроков А и В называет число 1 или 2, не зная о выборе своего противника. А получает 1 фунт •стерлингов от В, если названные числа различны; А платит 1 фунт игроку В, если эти числа совпадают. Платежная матрица для игрока А имеет вид:

Пример (б).

Для игры предыдущего примера рассматривается измененная платежная мат-

рица:

м; -и-

согласно которой, например, если А и В оба называют 1, то А получает от В 2 фунта.

Пример (в).

Игра с двумя ходами состоит в том, что при первом ходе игрок А называет одно из трех чисел: 1, 2 или 3; при втором ходе В тянет карты из колоды до тех пор, пока не вытянет туза. Перенумеруем стратегии игрока В в соответствии с мастью этого туза: 1 — пики, 2—черви, 3—бубны, 4—трефы.

Определим платежную матрицу следующим образом: 0 —2 —1 3

А = 2

3 12 3

4 0 —4 согласно которой, например, партия заканчивается вничью (без платежа), если А назовет 1 и В вытянет туза пик.

Пример (г).

Две лошади участвуют в скачках. Пари определяются ставками и выигрышами лошадей (2 к 1 за первую лошадь и 2 к 1 против второй лошади)80 которые определены заранее. Игрок А ставит 1 фунт на одну из лошадей, но он совершенно не знает степени их готовности к состязаниям. Игрок В представляет собой комбинацию всех сил, определяющих результат скачек (например, букмекер, владельцы и жокеи). Платежная матрица игрока A («punter») будет:

--1

Пример (<д).

Меховое пальто, оцененное в 100 фунтов, можно за 1 фунт застраховать от пожара. Игрок А (владелец пальто) выбирает между двумя стратегиями:

1 ... Страховать; 2 ... Не страховать.

В роли игрока В, который решает быть (стратегия 1) или не быть (стратегия 2) пожару, выступают силы природы.

Платежная матрица для А будет:

А=г [-100 о] '

Пример (е).

Игра Морра («Могга») широко распространена в Италии. В варианте игры, называемом two-finger Могга (двухпальцевая Морра), игрок А показывает один или два пальца и называет вслух число пальцев (тоже один или два) которое, по его предположению, назовет игрок В. Одновременно с ним совершенно так же поступает игрок В. Каждый игрок имеет четыре стратегии, которые могут быть перенумерованы: 1 ... (1, 1), 2 ... (2, 1), 3 ... (1, 2), 4 ... (2, 2), где первый номер в скобках обозначает число показанных, а второе — число названных игроком пальцев. Если только один игрок угадывает правильно, то он получает выигрыш, равный сумме числа показанных игроками пальцев; если ни один не угадывает или правильно угадают оба, то платежи не производятся. Платежная матрица для этой игры имеет вид 0 — 3 2 о- 3 0 0 — 4 — 2 0 0 3 0 4 — 3 0- Пример (ж).

Игра имеет три хода, I, II и III.

I. В выбирает одно из двух чисел 1 и 2; выбранное число назовем р.

IT. Не зная /?, А выбирает число q из 1 и 2;

111. Не зная р и q, В выбирает число г из 1 и 2.

Можно представить, что при третьем ходе или В забывает, какое число р о к выбрал при первом ходе, или что «игрока» В представляют два индивидуума, каждый из которых не знает выбора, сделанного его напарником. Платеж при расчете представляет сумму (р+д + г)> которую выигрывает игрок А, если q равно г, и игрок В, если q не равно г.

У игрока А имеются две стратегии:

1 ... (д = 1), 2 ... (<7 = 2).

У игрока В—четыре стратегии:

1 ... (р = 1, /• = 1), 2 ... (р=2, г=1), 3 ... (р= 1, г=2), 4 ... (р=2, г = 2).

Платежной матрицей для игрока А будет матрица

Г 3 4-4-5]

А- I __4 _5 5 6J '

Задачи и упражнения 1.

Определить игру «крестики и нолики», то есть указать ходы и возможные выборы при каждом ходе. Показать, что партия состоит из неопределенного, но конечного числа ходов. Построить схему платежей. 2.

Сколько «ходов» в игре бридж? Сколько выборов в партии этой игры? 3.

Написать платежную матрицу для игрока В в примере (а) этого раздела. 4.

Придумать описание игры в два хода с платежной матрицей:

Г1 2 0] L2 -1 3J • 5.

Условия примера (г) этого раздела распространить на случай трех лошадей, предполагая, что пари заключаются на условиях 1 : 1; 2 против 1 и 3 против 1. Показать, что матрица:

11 —1~

— 1 2 —1 — 1 — 1 3_

будет платежной матрицей для этой игры. 6.

Обобщить условия примера (е) на случай «three-finger Могга» (трехнальце- вая Морра) и показать, что в этом случае платежная матрица будет 9x9.

<< | >>
Источник: Р. Аллен. МАТЕМАТИЧЕСКАЯ ЭКОНОМИЯ. 1963

Еще по теме 14.2. ИГРА ДВУХ УЧАСТНИКОВ С НУЛЕВОЙ СУММОЙ И ЕЕ ПЛАТЕЖНАЯ МАТРИЦА:

  1. 14.7. ОБЩИЙ СЛУЧАЙ ИГРЫ ДВУХ^УЧАСТНИКОВ НУЛЕВОЙ СУММОЙ
  2. 15.5. ЭКВИВАЛЕНТНОСТЬ ОБЩИХ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ И ИГРЫ С ДВУМЯ УЧАСТНИКАМИ И НУЛЕВОЙ СУММОЙ
  3. Принцип игры с нулевой суммой
  4. 14.6. ГРАФИЧЕСКОЕ РЕШЕНИЕ ДЛЯ ИГР С ПЛАТЕЖНОЙ МАТРИЦЕЙ 2 х п
  5. 12.3. РАВЕНСТВА, НЕРАВЕНСТВА МАТРИЦ, СЛОЖЕНИЕ МАТРИЦ И УМНОЖЕНИЕ МАТРИЦЫ НА СКАЛЯР
  6. 12.7. ОБРАТНЫЕ МАТРИЦЫ. ВЕЛИЧИНА ОПРЕДЕЛИТЕЛЯ МАТРИЦЫ
  7. ПЛАТЕЖНЫЕ СРЕДСТВА В РИМЕ
  8. § 4. Законное платежное средство и объект денежного обязательства
  9. § 2. Действие иностранных законов о платежной силе денег
  10. ПЛАТЕЖНЫЕ СРЕДСТВА И МОНЕТНЫЕ СИСТЕМЫ В ГРЕЦИИ