14.9. ИЛЛЮСТРИРУЮЩИЕ ПРИМЕРЫ^
Пример (а).
Матрица А=| 2 З 1 I известна статистикам под названием латинского квадрата
L3 1 2 J
(3-го порядка). Каждая цифра (1, 2, 3) встречается по разу в каждой строке и в каждом столбце. Матрица симметрична, ее не нужно упрощать, так как в ней нет ни отрицательных, ни дробных элементов, она не имеет седловой точки, и соответствующие переменные, определяющие оптимальные стратегии, должны быть найдены из следующих условий, относящихся к хг:
^1+^2+^3 = ! 2я1 + За:2+Яз > v
ЯІН-2Я2+ЗЗЗ > v 3^+^2+2^3 >г>
и подобных же соотношений между ys. Поэтому оптимальные стратегии игроков совпадают.
Рассматривая приведенные четыре соотношения как уравнения, находим: хг?=х2=
1 о
= х3 = — и i>-=2.
Следовательно, в устойчивом исходе смешанная стратегия для каждого игрока ґ \ 1 1 \
задается вектором ( -у , -у , ~зу ' т0 есть стРатегии имеют равные относительные
частоты, и цена игры равна 2. Пример (б).
-3 О О 4 >
4-'
Матрица А =
не является ни симметрической, ни кососимметри- ческой. Следовательно, можно ожидать, что игроки принимают различные стратегии. Пусть цена игры будет v\ она, вероятно, будет положительной.
Упростим матрицу А, умножая ее на 2 и затем прибавляя 2 к каждому ее эле-
[8 2 21
4 16 имеет такие же оптимальные стратегии, как и исход- 6 5 0J
ная игра, а ее цена равна v = 2(y+l). Полученная игра не имеет седловой точки. Соответствующие переменные удовлетворяют соотношениям:
Xi+Xz + Xs^i #1 + 2/2 + ^3 = 1»
885і +4*2+6*3 > V &уі+2у2+2у3 < v, 2*r+*2+5х3 > v 4у!+у2+6у3 < v, 2хг+6*2 > V 6 уг+5Г/2 < V.
Рассмотрим все эти соотношения как уравнения и, решив систему четырех уравнений, записанных слева, получим:
1 _ 3 _ 3 7
xi=—2"' х*~~1[9 — v—~2 *
что неприемлемо, так как *х<0.
Теперь будем считать одно из соотношений строгим неравенством. Испытаем неравенство8*!+4*2+6*з > v, с которым связано 2/i = 0. Теперь уравнения будут
*1 + *2+*3 = 1 ^2 + 2/3=1»
2*I+*2+5*3==V 2y2+2y3 = v, 2хх+6*2 =v 2/2+6^3 = v,
„ „ v v*
Последние два уравнения из уравнении относительно ys дают_±у2=—— , г/3 = 9
о 5
что неприемлемо, так как другие уравнения относительно г/8; при этих значениях у2 и г/3 не удовлетворяются. Уравнения несовместны. Любой другой выбор одного соотношения приводит к такому же отрицательному результату.
На следующем этапе берем два соотношения в форме строгих неравенств. Предшествующая попытка наводит на мысль попробовать испытать в качестве строгого неравенства одно из соотношений для ys, например берем:
8*i+4*2+6*з >v и 2/i=0,
8^1+2у2+2г/3 <[ v и *1==0.
Рассмотрим оставшиеся соотношения как уравнения:
х2+х3 = 1 г/2+2/з=1,
*2+5*3 = v 2/2+62/3 = ^, 6tf2 = V 5t/2 = V. Они совместны, и их решением является:
1 1 3 2
х2 = ~2> Хз==~2 ' ' ^"Т* V '
Следовательно, решение исходной игры состоит в том, что оптимальной страте-
/ 1 1 \ / 3 2 \ тией для А является (О, у, ) и -g-J для 2?. Цена игры v находится
из уравнения: v = 2(t>-f-l) = 3, то есть i>=—. Игра становится «справедливой», если
в каждой партии игрок А платит V2 игроку В. Пример {в).
[1 — 1 —1] -1 2 —1 з -1 -1 3J
[Ту. полу*
[2 0 01
0 3 0 0 0 4J
Игрок А ставит на три лошади; выплаты в случае победы каждой лошади
относятся к ставке как 1:1, 2:1 и 3:1. Платежная матрица I —1 2 —1 может быть
L-i -і 3J
упрощена прибавлением 1 к каждому ее элементу. Получим диагональную матрицу:
Если цена исходной игры равна v, то цена для йгры с матрицей А равна (у+1)» Оптимальные стратегии для этих двух игр одни и те же. Запишем соотношения между хт в виде уравнений:
= 2x1 = v-f-1, 3#2 = у+1» 4я3 = г>+1,
и точно такую же систему уравнений запишем для ys. Системы этих уравнений дают совпадающее решение для хт и
6 . 4 3 .
. 12хх = Уi = J3 » = = = ; г? + 1==їз-
™ ' 1
Игра на скачках имеет цену и=—jg ; тот, кто ставит на лошадь, в итоге проигрывает, а выигрывает «букмекер». Для того чтобы достичь такого оптимального результата (иначе можно проиграть большую сумму), надо ставить на лошадей в смешанной стратегии ~, ^, • Лучше всего разделить ставку между тремя
лошадьми в пропорции 6:4:3.
«Устроители», определяющие соотношение ставок, также знают, что шансы лошадей на победу соответственно равны J3' и J3 • Зная соотношение 6:4:3 между
шансами на победу,устроители тотализатора, если бы они стремились быть совершенно справедливыми, установило бы следующие условия ставок:
7:6; 9:4 и 10:3.
В действительности же эти условия (1:1, 2:1, 3:1) были несколько менее благоприятны для игроков:
41^6' 14* 1^3 J1
что и давало букмекеру возможность выигрыша.
Не всегда шансы бывают таковы, что и получается отрицательным, и букмекер выигрывает. Например, как заметил Г. Мортон, в канун розыгрыша Большого Национального приза 1954 года условия ставок при оптимальном их распределении дали бы игрокам выигрыш в 4% от суммы ставок, и в итоге букмекеры имели бы верный проигрыш в этом размере.
Пример (г).
Платежной матрицей для игры «двухпальцевая Морра» (смотри пример (е) из раздела 14.2) является матрица 0 — 3 2 о- 3 0 0 —4 — 2 0 0 3 0 4 — 3 0-1 Матрица кососимметрическая, игра справедлива (цена нулевая), и игроки имеют одинаковые оптимальные стратегии. Это упрощает соотношения. Именно получаем:
^1 + ^2 + ^3+^4=1»
3*2—2*3 ^ О, — 3*х + 4*4>0,
2*1 — 3*4 > О,
—4*2+3*3 >0
и такие же соотношения между у&.
Все пять соотношений, рассматриваемые как уравнения, несовместны. Тогда возьмем одно из соотношений в форме строгого неравенства. Пусть это будет 3*2 — 2*3 > 0, так что г/і = 0 и, следовательно, из-за симметрии между переменными ^=0. В таком случае останутся соотношения:
4*4= —3*4 = 0,
—4*2+3*3=0,
которые дают *2 = у, *3=^у, *4=0.
Следовательно, стратегия ^0, -у, у, 0^является оптимальной стратегией для того и другого игрока. Однако это решение не единственно. Выделим как строгое неравенство —4*2+3#з>0, так что з/4=0 и, следовательно, *4 = 0.
Получим тогда уравнения:
*1+*2 + *з=1,
3*2—2*з—0, —3*i 2*i — 0,
которые дают
хг = 0, х2 = — и *3 = —.
Поэтому стратегия ^0, -g- , ~ , 0^ является другой оптимальной стратегией для
каждого игрока. Так как любая выпуклая линейная комбинация оптимальных стратегий также является оптимальной стратегией, то из того факта, что найдены два решения, следует, что существует бесконечное множество решений, то есть стратегия (0, *, 1 — *, 0) является оптимальной стратегией при любом * из области
Результат, полученный в конце раздела 14.8, может быть проверен на этом примере. Предположим, что игрок А придерживается смешанной стратегии Ґ 29 41 Л
V ' 70* 70' которая является одной из его оптимальных смесей. Тогда, при
условии, что В применяет только одну вторую или одну третью стратегию, игра является ничейной (цена игры равна 0):
-3-0+0- G+0- §+4-0=0,
2-0+0- G+0- §-3-0=0,
Но если В применит отдельно первую или четвертую стратегии, которых нет среди его оптимальных смесей, тогда А выигрывает:
°-°+3- То'2' To+°-°=U>
0-0-4- G+З- §+0-0 =I.
Следовательно, даже, если А заранее объявит, что он собирается делать (например, играть вторую и третью стратегии в пропорции 2:3), В никак не может повлиять на исход игры. Стало быть, если В придерживается второй и третьей стратегии, смешивая их в любых пропорциях, то он всегда вынуждает ничейный исход. Если В уклоняется от оптимальной комбинации и применит или первую или четвертую стратегии, он проигрывает игроку А
Для играющего в эту игру решение совсем не является очевидным с самого начала. Полезный для него совет заключается в том, что он должен играть только вторую и третью стратегии (то есть показывать два пальца, а называть один, или показывать один палец, а называть два) и использовать вторую стратегию 14 или 15 раз, а третью 21 или 20 раз в каждых 35 партиях.
Пример (д).
Рассмотрим проблему инвестиций, при формулировке которой мы использовали пример 16 из [И].
У вас есть долг, который необходимо уплатить по истечении года, и 1000 фунтов, которые можно использовать сейчас.
Вы советуетесь с вашим маклером о возможностях вложения этой суммы в три вида акций, и он говорит, что доходы за год (дивиденды и повышение стоимости капитала) зависят от оценки экономических перспектив на год и, вероятно, будут такими, как элементы следующей платежной матрицы (в фунтах): Акции Перспективы хорошие удовлетворительные плохие Ценные бумаги .... 40 30 20 Акции отраслей, про изводящих вооруже ние 0 100 250 Акции прочих отраслей 150 50 -50 Как играть на бирже, чтобы получить наибольший доход?Допустим, что вы руководствуетесь минимаксным принципом и по отношению к состоянию экономики принимаете во внимание наихудшее, что может случиться. Вы решаете «игру» против экономических сил, задаваемых платежной матрицей. Всего имеется восемь соотношений между семью переменными. Переменные Xlt а?2, х3 определяют пропорции вложений; переменные у19 г/2, Уз характеризуют состояние экономики и г> — ваш доход. Находить решение можно в соответствии с изложенными выше практическими приемами (см. упражнение 5 к этому разделу). Но нужно заметить, что над первой строкой матрицы доминируют различные комбинации двух других строк и она может быть удалена из платежной матрицы. Остается матрица
ГО 100 2501 L150 50 —50 J
Теперь применим графический метод решения, данный в разделе 14.6 (см. упражнение 6 и указание к нему). Тем или другим методом вы найдете, что комбинация (0, 86/2, 1/2) является вашей оптимальной стратегией, и что цена игры равна 75 фунтов. Поэтому вы решаете вложить ваши 1000 фунтов равными суммами в акции отраслей, производящих вооружение, и в акции прочих отраслей, и совсем не вкладывать деньги в ценные бумаги. Если год окажется хорошим или удовлетворительным, вы продадите акции и получите прибыль в 75 фунтов. Если год будет плохой, то есть «стратегия» экономического состояния не будет находиться в соответствии с минимаксным принципом, вы заработаете больше, а именно 100 фунтов. Существуют даже большие возможные выигрыши; так, если год будет «хорошим», акции прочих отраслей принесут доход в 150 фунтов, если год «плохой», то 250 фунтов дадут акции вооружения.
Однако.для получения таких доходов, вам необходимо знать или предугадать, каким же будет год. Не имея такой информации, вы вкладываете деньги в акции вооружений и акции прочих отраслей в пропорции 50 : 50 и обеспечиваете верных 75 фунтов дохода. платежнои матрицей латинский квадратЗадачи и упражнения 1. Показать, что для игры, имеющей ГІ 2 3 4" 1
2
3J
четвертого порядка А =
цена игры ь> = —. п + 1
является
2. Обобщить результат предыдущего упражнения и показать, что ценой игры, для которой платежной матрицей служит латинский квадрат порядка п X п. 3.
В игре «двухпальцевая Морра» игрок А знает, что его противник применяет только вторую и третью стратегии, и тогда сам ограничивается также этими двумя стратегиями. Показать, что полученная игра с платежной матрицей ^ о J не пРотивоРечит
тому положению, что стратегии (о, х, 1 — х, 0) (при 87/5 ^ х 3/7) являются оптимальными для игроков. 4.
Игра «трехпальцевая Морра» имеет платежную матрицу 9X9. Показать, что оптимальной стратегией для каждого игрока является (0, 0, 5/12, 0, 4/12, 0, 3/і2, 0,0). Объяснить это решение и сравнить с решением для игры «двухпальцевая Морра». 5.
Решить пример (д) настоящего раздела, в котором имеется восемь соотношений между семью переменными. 6.
Взять матрицу А или 2 X 3 из вышеприведенного примера (д), решить игру графическим методом раздела 14.6 и получить единственное решение х : (1 — х)~1 : 1.
7. Если А=
показать, что
•0—1—3 1 3" 1 о 3—3—1 — 1 —2 З, 1 —1 L 0 3—3 1 —1_ при устойчивом исходе игрок А должен играть свои четыре стратегии с равными относительными частотами и что игра справедлива. Затем показать, что у игрока В оптимальная стратегия не единственная. 8.
Рассматривается игра, в которой для определения исхода каждой партии используется элемент случая. Сначала подбрасывается не имеющая изъяна монета, и определяется, выпал герб или решка. Зная результат подбрасывания монеты, игрок А называет число р, равное 1 или 2, а игрок В — число q, также равное 1 или 2. Если p=q, то платеж не производится; если p^q, то сумму (р + д) получает А, если выпал герб, и В, если выпала решка. Показать, что каждый игрок имеет четыре стратегии и платежная матрица игры имеет вид:
А =
| » о-! -4 о о і .0 -4 і _ о
Пользуясь сходством А с платежной матрицей игры «двухпальцевая Морра», найдите решение рассматриваемой игры. 9.
Рассмотрите платежную функцию А(х, у) =4^а?—у ^ ' где переменные
[ 1 -l] '
щая платежную матрицу игры.
х и у непрерывны и где А выбирает х я В выбирает у из отрезка (0, 1). Покажите возможности существования игры с бесконечным множеством стратегий. На основе минимаксного принципа покажите, что х=У2, у является оптимальным выбором для игроков. Объясните далее, каким образом игра с двумя стратегиями у каждого игрока, имею-
может рассматриваться как частный случаи такой
Еще по теме 14.9. ИЛЛЮСТРИРУЮЩИЕ ПРИМЕРЫ^:
- И.
- Теория литературной эволюции
- 14.9. ИЛЛЮСТРИРУЮЩИЕ ПРИМЕРЫ^
- ПРИНЦИП СИСТЕМАТИЧНОСТИ И ПОСЛЕДОВАТЕЛЬНОСТИ
- Материя и форма. Возможность и действительность
- Эффект контраста
- Контроль
- Корреляционное исследование
- 1. Специфика применения убеждения.
- 1. Специфика применения убеждения.
- Логические ошибки в синтаксических конструкциях
- §4.1. Чем отличается будущее от прошлого?
- В. Вольчик НЕЙТРАЛЬНЫЕ РЫНКИ, НЕНЕЙТРАЛЬНЫЕ ИНСТИТУТЫ И ЭКОНОМИЧЕСКАЯ ЭВОЛЮЦИЯ[34]
- История развития статистических подходов к управлению процессами — базиса TQM
- УСИЛИЯ БИЗНЕСА ДЛЯ МИНИМИЗАЦИИ КОНФЛИКТОВ
- Г. ПРИНЦИПЫ ПРОЕКТИРОВАНИЯ ДЕТАЛЕЙ
- А. ВИДЫ БРАКА И ЕГО ПРИЧИНЫ
- А. И. Захаров ОТНОШЕНИЯ В СЕМЬЕ. ОСОБЕННОСТИ ВОСПИТАНИЯ (РЕБЕНКА, БОЛЬНОГО НЕВРОЗОМ)
- Обоснование схем развития транспортной сети