<<
>>

Модели множественного выбора

Модели множественного выбора, когда имеется не две, а несколько альтернатив, можно строить и изучать, обобщая подходы и методы, используемые для моделей бинарного выбора.

Номинальные зависимые переменные

Бели соответствующая переменная является номинальной (качественной), то множественный выбор может быть представлен как последовательность бинарных выборов.

Поясним это простым примером. Предположим, что изучается выбор одной из трех профессий: инженер, научный работник, преподаватель. Введем три бинарных переменных, соответствующих каждой профессии: у% = 1 для инженеров, у* = 0 для всех остальных; уа = 1 для научных работников, у9 = 0 для всех остальных; у1 = 1 для преподавателей, у1 = 0 для всех остальных.

Тогда выбор одной из трех альтернатив можно описать в виде «дерева» последовательных решений, в узлах которого происходит бинарный выбор.

В каждом узле, применяя технику оценивания для бинарных моделей, можно оценить условную вероятность выбора соответствующей альтернативы. Безусловная вероятность вычисляется по формуле умножения вероятностей. Так, например,

Р(»У = 1) = Р(у< = 0, у' = 0) = Р(у< = 0)Р(уа = 0 | у' = 0).

В последнем произведеиии первый сомножитель оценивается в первом узле (стрелка вниз), второй — во втором (стрелка вниз). Обобщение этого метода на случай любого числа альтернатив не представляет труда.

Однако у данного способа построения моделей множественного выбора есть очевидный недостаток: «дерево» последовательных решений можно строить по-разному, и результаты оценивания будут, вообще говоря, разными.

Другой подход к моделям множественного выбора с качественной зависимой переменной основан на понятии случайной полезности (как уже отмечалось выше, в probit- или Іодіі-моделях скры- тую переменную можно интерпретировать как разность полезно- стей альтернатив 1 и 0).

Итак, предположим, что имеется m альтернатив. Будем считать, что для индивидуума t альтернатива j имеет полезность Utj = Ufj + etj, где utj — неслучайная составляющая, a etj — случайная составляющая полезности. Тогда индивидуум t выберет альтернативу j, если Utj > Utk для любого к ф j. Иными словами,

(12.11)

P(lft = Э) = P(uy + ?tj > Щк + etk Vfc ф j, к = 1,... m).

В общем случае для нахождения этой вероятности требуется вычислять многомерные интегралы по соответствующим областям от плотности совместного распределения ошибок Єц. Как правило (в частности, для нормально распределенных ошибок etj), эти интегралы невозможно выразить аналитически, а можно лишь найти численно, что, в конечном итоге, делает модель не применимой на практике. Есть, однако, некоторое специальное распределение, для которого вероятность Р(yt = j) в (12.11) допускает достаточно простое представление. Предположим, что ошибки ?tj независимы и имеют функцию распределения F(x) = ехр(—е-1) (такое распределение возникает при изучении максимума независимых случайных величин, поэтому его часто называют распределением экстремальных значений). Тогда можно доказать, что

Pfo = j) = , , .. (12.12)

exp(«ti ) + ••• + exp(utm)

Utj = x'tjP,

получаем модель

Предполагая, что полезность «у зависит от наблюдаемых экзогенных характеристик xtj и неизвестных параметров (3: которая называется logit-моделью множественного выбора (multinomial logit model)1.

Среди экзогенных переменных xtj могут быть характеристики, зависящие только от индивидуума и не зависящие от альтернативы.

Если, например, анализируется проблема выбора профессии, то естественно включить в xtj такие факторы, как возраст, уровень образования, социальный статус и т.п., которые не зависят от профессии. Выделим такие переменные: x'tJ- = [j/^, z't], и соответствующим образом разобьем вектор неизвестных параметров на две компоненты: /3' = [7', б']. Тогда числитель и знаменатель правой части формулы (12.13) будут содержать общий сомножитель ехр(г^б), а это означает, что вектор параметров б оценить невозможно (неидентифицируемость). Следовательно, если необходимо учесть индивидуальные эффекты, logit-модепъ множественного выбора должна быть модифицирована. Например, можно считать, что коэффициенты б могут зависеть от альтернативы, т.е. utj = y'tji + z'tSj. В примере с выбором профессии подобное предположение выглядит реалистичным: при одном и том же уровне образования полезность разных профессий разная (при прочих равных).

Часто в литературе рассматривается модель, когда

u tj = x't(3j,

т. е. когда экзогенные переменные не зависят от альтернативы, а коэффициенты могут от нее зависеть. В этом случае

р(!» - Л - Mp(xi/3l)T

и эту модель также называют logit-моделъю множественного выбора. Заметим, что модель (12.14) неидентифицируема, поскольку правая часть формулы (12.14) зависит только от разностей

'Иногда (см , например, (Greene, 1997)) эту модель называют условной Іодіі-моделью (conditional logit model).

/32 — /3j, ..., (Зт — . Поэтому для идентифицируемости модели (12.14) обычно используют нормировку = 0:

P(yt = 1) = 1 + ехр{хМ + ... + exp(x't/3m)'

. _ exp(x't/3j) (12ЛЬ)

Р(yt - 3) - 1 + ехр(хМ + ... + exp(x't/3m)' 3>2-

Нетрудно видеть, что при m = 2 модель (12.15) — это обычная /<и/#-модель бинарного выбора (12.3). Модель (12.13) при тп = 2 тоже сводится к обычной logit-модели, если в качестве независимых переменных рассматривать xt2 — хц.

Существенным ограничением, лежащим в основе logit-модели множественного выбора, является предположение о статистической независимости полезностей utj по j. Оно выглядит нереалистичным, если среди альтернатив есть достаточно близкие. Классический пример такой ситуации, содержащийся во многих книгах по эконометрике, дает анализ того, каким образом индивидуум попадает из дома на работу (пешком, метро, автобус, личный автомобиль). Предположим, что в городе существуют две конкурирующие транспортные компании, предоставляющие примерно одинаковые по качеству услуги («красный автобус» и «синий автобус»). Следует ожидать, что полезности этих двух альтернатив достаточно близки, что вступает в противоречие с их независимостью.

На эту же проблему можно посмотреть немного иначе. Из (12.12) следует, что

Р Ы = 3) = exp(utj) Р (yt = к) exp(utjk)

при любых j,k = 1,..., m, т. е. отношение вероятностей двух альтернатив не зависит от остальных возможностей. Это свойство получило название «независимость от посторонних альтернатив» (independence of irrelevant alternatives). Если в нашем примере считать, что первая альтернатива — это личный автомобиль, а вторая — «красный автобус», то отношение P(j/t = 1)/P(yt = 2) должно быть одно и то же, независимо от того, является третьей альтернативой «синий автобус» или метро, что выглядит весьма нереалистично.

Более подробно о /одіі-модели множественного выбора можно прочесть в книге (Greene, 1997).

Порядковые зависимые переменные

Если альтернативы упорядочены, то, используя скрытую (латентную) переменную, можно построить естественное обобщение модели (12.4), (12.5). Поясним на примере. Предположим, что у семьи есть три возможности провести отпуск: 1

— отдыхать на даче; 2

— отдыхать в Крыму; 3

— отдыхать в Испании.

Выбор места отдыха, описываемый переменной г/, зависит от текущих накоплений у* следующим образом:

у = 1, если у* ^ сі, у = 2, если сі < у* ^ с2,

у = З, ЄСЛИ У* > С2,

где сі,с2 — некоторые фиксированные уровни. Предполагая, что величина у* удовлетворяет уравнению (12.4), и считая для простоты, ЧТО дисперсия ошибок (7 = 1, имеем:

P(yt = l) = F(ci-x't/3),

P(yt = 2) = F(c2 - x't /3) - F(ci - x't /3), (12.16)

P(j/t = 3) = 1 - F(c2 — x't /3).

Выбирая в качестве функции F(-) функцию нормального или логистического распределения, будем получать порядковые probit- или logit-модели.

Функция правдоподобия имеет следующий вид (ср. (12.8)):

? = IjF(ci—®'t/3) Л(F(c2—ac't ($)-F(c\-x't/3)) H(l-F(c2-*'t/3)).

Vt=l I/t=2 у i=3

Уровни cj, С2 могут быть априорно заданы, а могут быть неизвестны. В любом случае на основании этой формулы для порядковых probit- или /<ф#-моделей можно строить оценки максимального правдоподобия параметров /3 и, если необходимо, сі, сг.

В общем случае модель упорядоченного множественного выбора с m альтернативами кратко описывается следующим образом. Пусть —оо = со < cj < • • • < Cm-\ < Сщ = оо — точки на числовой прямой, и (скрытая) переменная у* удовлетворяет уравнению (12.4):

УЇ =x't(3 + ?t.

Тогда

Р(yt = j) = Р(с7-і < y*t Таким образом,

P(yt = j) = F{Cj — x'tl3) — F{cj-\ - x't /3), j = 1,..., m, (12.18)

где F(-) — функция распределения ошибки et. Предполагая независимость ошибок, получаем следующее выражение для функции правдоподобия:

т

L = U П (FiCj-x'tft-Ficj-i-x'tfi)). j=1 {t: »,=j}

Максимизируя эту функцию, получаем оценки параметров /3 и Cj, j = l,...,m- 1.

Пример. Анализ рейтингов российских банков. Этот пример основан на работе (Пересецкий, Карминский, ван Сует, 2003). Одной из важнейших характеристик банка является его надежность. Различные организации (журналы, аналитические центры и т. п.) регулярно публикуют рейтинги надежности банков. Часто методики, по которым эти рейтинги строятся, являются закрытыми и, как правило, используют экспертные оценки. Возникает естественный вопрос, можно ли связать рейтинг банка с показателями его деятельности. В работе (Пересецкий, Карминский, ван Сует, 2003), в частности, построена модель упорядоченного множественного выбора (12.17), (12.18), использующая данные Информацион- пого центра (ИЦ) «Рейтинг». В этих данных содержится информация о рейтингах 115 российских банков, ранжированных по 6 группам надежности (п = 115, m = 6). В качестве объясняющих переменных х были выбраны следующие показатели:

BP/SK — прибыльность капитала;

DOSTKAP — достаточность капитала (Норматив Hi ЦБ РФ);

DKE/VB — доля долгосрочных кредитов экономике в валюте байка;

MGLIK — мгновенная ликвидность (Норматив Н2 ЦБ РФ);

SK — собственный капитал.

Оценивание модели (12.17), (12.18) дало результаты, представленные в таблице 12.2.

Таблица 12.2 Переменная Коэффициент BP/SK -0.132 DOSTKAP 0.054 DKE/VB 2.904 MGLIK -0.019 SK -7.63 • Ю-07 При этом вес коэффициенты, за исключением коэффициента при DKE/VB, оказались значимыми на 1%-пом уровне, а коэффициент при DKE/VB значим на 5%-иом уровне. Знаки коэффициентов согласуются со здравым смыслом и экономической интуицией. Отмстим, что в этой модели уменьшение зависимой переменной соответствует повышению рейтинга, поэтому отрицательный знак коэффициента означает, что увеличение соответствующего фактора (при прочих равных) способствует повышению надежности.

Для оценки качества модели для некоторой группы банков были построены рейтинги, предписываемые моделью (модельные рейтинги) и проведено сравнение с рейтингами ИЦ «Рейтинг» (реальные рейтинги). Коэффициент Спирмэна между этими рейтингами оказался равным 0.76, для 80% банков модельные рейтинги совпали с реальными, и для всех банков отклонение модельного рейтинга от реального не превышало 1 (в ту или другую сторону). Эти факты свидетельствуют о достаточно высоком качестве построенной модели.

<< | >>
Источник: Магнус Я.Р., Катышев П.К., Пересецкий АЛ. Эконометрика. Начальный курс: Учеб. — 6-е изд., перераб. и доп. — М.: Дело. — 576 с.. 2004

Еще по теме Модели множественного выбора:

  1. 12.1. Модели бинарного и множественного выбора
  2. Глава З Модель множественной регрессии
  3. 13.6. Выбор модели
  4. 13.8. Модели бинарного выбора с панельными данными
  5. Тема 27. ВЫБОР МОДЕЛЕЙ МАКРОЭКОНОМИЧЕСКОЙ ПОЛИТИКИ ГОСУДАРСТВА
  6. Айгумова Заграт Идрисовна Этнопсихологическая проблема выбора брачного партнера и модели приспособления в биэтнических семьях
  7. 14.9. Выбор модели: от общего к частному и от частного к общему
  8. § 158. Употребление единственного числа в значении множественного и множественного в значении единственного 1.
  9. ВИТРИНА УПРАВЛЯЕМОЙ ДЕМОКРАТИ (выборы без выбора в Башкортостане)
  10. Группа С. Медиаобразовательные модели, представляющие собой синтез социокультурной, образовательно-информационной и практико- утилитарной моделей Медиаобразовательная модель А.В.Шарикова [Шариков, 1991]*
  11. 20 Можно ли изымать тиражи печатных СМИ (не являющихся двойниками существующих СМИ) в период выборов для обеспечения административного производства по нарушению законодательства о выборах?
  12. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
  13. ГЛАВА 12. МНОЖЕСТВЕННОСТЬ ПРЕСТУПЛЕНИЙ
  14. Вопрос 32. Множественность преступлений
  15. ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
  16. Глава 4 Различные аспекты множественной регрессии
  17. Глава 5 Некоторые обобщения множественной регрессии
  18. ГЛАВА 1 ПАУТИНООБРАЗНАЯ МОДЕЛЬ И ДРУГИЕ ПРОСТЫЕ ДИНАМИЧЕСКИЕ МОДЕЛИ