Probit- и fogtt-модели Описание моделей

Основной недостаток линейной модели вероятности есть следствие предположения о линейной зависимости вероятности Р(yt = 1) от /3 (см. (12.2)). Его можно преодолеть, если считать, что (12.3)

P(yt = l)=F(x't/3), где F(-) — некоторая функция, область значений которой лежит в отрезке [0,1].

В частности, в качестве F(-) можно взять функцию распределения некоторой случайной величины. Одна из возможных интерпретаций модели (12.3) выглядит следующим образом. Предположим, что существует некоторая количественная переменная у*, связанная с независимыми переменными Ф{ обычным регрессионным уравнением (12.4)

у; = x't/3+et, где ошибки ?t независимы и одинаково распределены с нулевым средним и дисперсией сг2. Пусть также F(-) — функция распределения нормированной случайной ошибки ?(/Таким образом,

yt = 1, еслиу^О,

yt = 0, если УІ < 0. '

Тогда, предполагая, что случайные ошибки et имеют одно и то же симметричное распределение F(-) (т.е. F(—x) = 1 — F(x)), получаем:

р ы = і) = р(у; ^ о) = р(®; p+et>o)

= P(et ^ /3) = P(?t < х[ /3) = F , (12.6)

что с точностью до нормировки совпадает с (12.3).

Замечание. В модели (12.4)-(12.6) параметры /3 и а участвуют только в виде отношения и не могут быть по отдельности идентифицированы (т.е. оценить можно лишь /3/(7). Поэтому в данном случае без ограничения общности можно считать, что <7 = 1. Наиболее часто в качестве функции F(-) используют: —

функцию стандартного нормального распределения:

и

F(u) = Ф(и) = [e-^dz v2ir J —00

и соответствующую модель называют probit-моделъю; —

функцию логистического распределения:

F(u) = A(u) = —— v ' v ' l + eu

и соответствующую модель называют logit-моделыо. В свете рассмотренной выше интерпретации модели (12.3) использование функции нормального распределения представляется достаточно естественным. Применение функции логистического распределения во многом объясняется простотой численной реализации процедуры оценивания параметров. Вопрос о том, какую из моделей (probit или logit) следует использовать в том или ином случае, является достаточно сложным. Можно, например, выбрать ту модель, для которой больше значение соответствующей функции правдоподобия. Отметим также, что для значений и, достаточно близких по модулю к нулю (напр* при и € [—1.2, 1.2]), функции Ф(и) и Л(и) ведут себя прим одинаково, в то же время «хвосты» логистического распре, ния значительно «тяжелее» «хвостов» нормального распре, ния. Практический опыт показывают, что для выборок с не( шим разбросом объясняющих переменных и при отсутстви, щественного преобладания одной альтернативы над другой і ственные выводы, получаемые с помощью probit- и logit-мо) будут, как правило, совпадать.

Поскольку модель (12.3) нелинейна по параметрам /3, і интерпретация отличается от привычной интерпретации коэс циентов линейных регрессионных моделей. Предположим, функции распределения F(-) есть плотность р(-). Диффер( руя по векторному аргументу х (приложение JIA, п. 19) и оп> нижний индекс t (номер наблюдения), получаем:

aP(L=1) рЫ /3)/3. (

Таким образом, предельный эффект каждого объясняющего тора Xj, j = 1,... ,к является переменным и зависит от знач всех остальных факторов х = (xj,..., хк)'-

При использовании этой модели для получения представл о «среднем» предельном эффекте рекомендуется ВЫЧИСЛЯТЬ изводные (12.7) для средних по выборке значений независі переменных Ф.

Оценивание модели

Для оценивания параметров /3 модели (12.3) обычно исполь метод максимального правдоподобия (глава 10). Предполо что наблюдения у\,... ,уп независимы. Поскольку yt может нимать значения только 0 или 1, то функция правдоподобия t следующий вид:

L = Цуг,... ,у„) = П (! " *Vt /3)) П F{<<<

У1=0 yt = l Отсюда легко вытекает, что t

Логарифмируя, получаем:

I = In L = Y}Vi Ь F(x't /3) + (1 - yt) ln(l - F(x't /3))]. (12.9) t

Дифференцируя равенство (12.9) по вектору /3 (приложение Л А, п. 19), получаем векторное уравнение правдоподобия

dl ^(ytpjx'g3) (1 - yt)p(x'tP)\ Q п т {-FM) ~ 1-FMfi) ) Xt - ° (1210)

Для logit-модели оно существенно упрощается. Действительно, пользуясь легко проверяемым тождеством А '(и) = А(и)(1 — А(и)), имеем

2>t-A(x't/3))xt = 0. t

Уравнение правдоподобия (12.10) является системой нелинейных (относительно /3) уравнений, в общем случае нельзя найти ее аналитическое решение и приходится прибегать к численным методам. Отметим также, что уравнение правдоподобия есть лишь необходимое условие локального экстремума. Можно показать (см., например, (Greene, 1997)), что для probit- и logit-моделей логарифмическая функция правдоподобия I является вогнутой по /3 функцией и, значит, решение уравнения (12.10) дает оценку максимального правдоподобия набора параметров /3. Процедуры оценивания probit- и logit-моделей реализованы в большинстве современных эконометрических компьютерных пакетов.

Пример.

Факторы некредитоспособности российских банков. Этот пример основан на результатах дипломной работы выпускницы РЭШ 1990 г. Б. Б. Баян-оол.

Как те или иные характеристики банка влияют на его жизнеспособность? Для исследования этой проблемы была рассмотрена

logit-модель с бинарной переменной, принимающей значения 1 или О, в зависимости от того, находится ли банк в критическом состоянии или нет. Решение о том, является ли банк проблемным или иет, принималось на основании рейтинга банков, опубликованного в журнале «Профиль» от 21 июня 1999 г. Значение 1 приписывалось банкам с отрицательным капиталом; банкам, имеющим 4-ю группу проблемности; банкам, у которых отозвана лицензия или принято решение об отзыве. Осгальным банкам присвоено значение 0. Из многочисленных характеристик банков (возраст, капитал, ликвидные активы, работающие рисковые активы, обязательства до востребования, суммарные обязательства, уставный фонд, чистые активы и т. п.) в окончательную модель после анализа и многочисленных попыток были включены следующие переменные:

TOTLIAB — суммарные обязательства (тыс. руб.);

CURRENCY — валютная составляющая (%);

EQUITY/ASS, где EQUITY - недвижимость (тыс. руб.),

ASS — чистые активы (тыс. руб.);

PROFIT/ASS, где PROFIT - прибыль (убыток) (тыс. руб.);

RETAIL/TOTLIAB, где RETAIL - средства частных лиц (тыс. руб.);

TOTLIAB/PREF, где PREF — работающие рисковые активы (тыс. руб.).

Модель включает 182 наблюдения. Результаты оценивания с помощью Цій-модели приведены в таблице 12.1. Полученные результаты согласуются с экономической интуицией. В частиоеги, в результате кризиса наименее устойчивыми оказались крупные и мельчайшие банки. Поскольку в выборке представлены средние и крупные банки, то положительность коэффициентов при переменных, характеризующих величину банка, согласуется с реальностью.

Таблица 12.1 Переменная Коэфф. Стапд. откл. t-статист. Р-знач. С -3.19 0.87 -3.68 0.000 TOTLIAB 2.14E-07 7.21E-08 2.97 0.003 CURRENCY -0.096 0.031 -3.13 0.021 EQUITY/ASS -8.58 3.71 -2.31 0.022 PROFIT/ASS -26.99 9.49 -2.84 0.005 RETAIL/TOTLIAB 3.53 1.23 2.87 0.005 TOTLIAB/PREF 2.00 0.90 2.23 0.027 328 Гл. 12. Дискретные зависимые переменные и цензурированные выборки Проверка гипотез

Для probit- или logit-моделей проверка гипотез о наличии ограничений на коэффициенты, в частности, гипотез о значимости одного или группы коэффициентов, может проводиться с помощью любого из трех тестов — Вальда, отношения правдоподобия, множителей Лагранжа, рассмотренных в главе 10 (п. 10.6). Большинство эконометрических пакетов, в которых реализованы probit- или logit-модели, имеют встроенные процедуры проверки ограничений с указанием метода тестирования.

Ошибки спецификации

Кратко рассмотрим проблемы, возникающие при нарушении некоторых предположений, лежащих в основе модели (12.3). Подробное изложение этого материала требует привлечения довольно сложных методов и выходит за рамки данной книги. Более детально эти вопросы изложены, например, в (Greene, 1997) или (Johnston and DiNardo, 1997).

где Ф(-) — функция стандартного нормального распределения.

Рассматривая реализацию (12.4), (12.5) модели (12.3) с помощью ненаблюдаемой переменной у*, мы предполагали, что ошибки ?t одинаково распределены, в частности, гомоскедастичны. Известно (п.6.1), что при нарушении этого условия, т.е. при наличии гетероскедастичности, оценки метода наименьших квадратов в линейных регрессионных моделях перестают быть эффективными, но остаются несмещенными и состоятельными. В нашем случае гетероскедастичность, вообще говоря, приводит к нарушению состоятельности и асимптотической несмещенности. На содержательном уровне это нетрудно понять, исходя из следующих соображений. Пусть ошибки et, t = 1,... ,п распределены нормально с пулевым средним и дисперсиями <7t, t = 1,... ,п (гетероскедастичность) и предположим, что выполнено (12.5). Тогда, повторяя выкладки (12.6), получим: Соответствующим образом изменится логарифмическая функция правдоподобия (12.9):

/ = lnL = ?

?

Это означает, что теперь необходимо оценивать п+к — 1 неизвестных параметров (без ограничения общности одну из дисперсий можно считать равной 1), что без дополнительных предположений невозможно сделать состоятельно на основе п наблюдений.

Аналогично тому, как это делается в тесте Бреуша-Пагана (глава 6), можно предполагать ту или иную форму зависимости дисперсий от экзогенных факторов и тестировать гипотезы об отсутствии гетероскедастичности (подробнее см. (Greene, 1997)).

В п. 4.4 мы рассмотрели проблемы исключения существенных и включения несущественных переменных для линейных регрессионных моделей. Можно поставить аналогичный вопрос: какое влияние оказывает пропуск существенных переменных в уравнении (12.4) на оценивание модели бинарного выбора (12.3)? Исчерпывающий ответ на него выходит за рамки нашей книги. Отметим лишь, что в данном случае, даже если исключенные существенные переменные ортогональны включенным, оценки параметров будут, в отличие от линейной схемы, смещенными и несостоятельными (подробнее см. (Greene, 1997) и (Johnston and DiNardo, 1997)).

<< | >>
Источник: Магнус Я.Р., Катышев П.К., Пересецкий АЛ. Эконометрика. Начальный курс: Учеб. — 6-е изд., перераб. и доп. — М.: Дело. — 576 с.. 2004

Еще по теме Probit- и fogtt-модели Описание моделей:

  1. Группа С. Медиаобразовательные модели, представляющие собой синтез социокультурной, образовательно-информационной и практико- утилитарной моделей Медиаобразовательная модель А.В.Шарикова [Шариков, 1991]*
  2. 4.3. ОПИСАНИЕ МНОГОПОТОЧНОЙ ИМИТАЦИОННОЙ МОДЕЛИ МГД
  3. ГЛАВА 1 ПАУТИНООБРАЗНАЯ МОДЕЛЬ И ДРУГИЕ ПРОСТЫЕ ДИНАМИЧЕСКИЕ МОДЕЛИ
  4. Модель материнства и «путь к модели» в условиях современного общества
  5. Логико-философское направление. Модель знака и     семиотическая модель коммуникации Ч. Пирса
  6. Коростелев, Иван Николаевич. Математическая модель стационарных физических полей и критерий МГД—стабильности В алгоритмах динамической модели алюминиевого электролизера / Диссертация / Москва, 2005
  7. Группа B. Медиаобразовательные модели, основанные на синтезе эстетического, образовательно-информационного и воспитательно- этического подходов Медиаобразовательная модель С.Н.Пензина [Пензин, 1987; 2004] *
  8. § 2. Право в космической модели мира и в универсалистской модели мира
  9. 13.7. Динамические модели
  10. 13.8. Модели бинарного выбора с панельными данными