Упражнения
Процесс, порождающий данные, описывается уравнением
Vt = fat + Єі,
Е et = 0, Е(е?) = <т2, Е = 0, tjts, t = l,...,n.
ВО второй группе ИЗ П2 наблюдений
Экспериментатор не имеет доступа к исходным данным, а может использовать лишь «групповые» данные.
А именно, значения независимой переменной упорядочиваются ПО величине (xi < Х2 < ? ? ? < хп), вычисляются средние значения в первой группе из щ наблюденийи т.д. Всего есть J групп наблюдений, j-я группа имеет объем п,-. Параметр 0 оценивается с помощью регрессии yj на Xj, j = 1,..., J. Вычислите среднее значение и дисперсию оценки. Оцените потерю эффективности в результате такой группировки данных.
в.З. Рассмотрим уравнение yt — a+0xt +?«, где ошибки et порождаются авторегрессионным процессом второго порядка:
et - Pl^t-l + P2Ct-2 + Vf
Предложите обобщение итеративной процедуры Кохрейна-Оркатта для Оценивания параметров этой модели.
Рассмотрим модель yt = 0xt + et, где
et = pet-i+«t, E«t = 0, Eu? = а) Покажите, что эта оценка является линейной и несмещенной.
б) Вычислите дисперсию оценки и покажите, что стандартная оценка этой дисперсии смещена.
Предположим, что для системы yt = а + 0xt + et, t = 1,..., п, выполнены все предположения классической нормальной модели за одним исключением: дисперсии ошибок удовлетворяют соотношениям
<т2 = fi + Sxt.
Предложите двухшаговую процедуру оценивания параметров а и 0.
Рассмотрим модель, связывающую количество вакансий wt и уровень безработицы ut:
lnitft = 01 +02ІПЩ + Є/.
Ошибки Et независимы и нормально распределены ЛГ(0,<т2).
а) Используя (искусственные) данпые из таблицы 6.6, найдите МНК-оценки параметров 0\ л 02, л также 95%-ный доверительный интервал для 02-
б) Вычислите статистику Дарбина-Уотсоиа. в) Оцените модель заново, используя модель автокорреляции первого порядка для ошибок регрессии. Найдите 95%-ный доверительный интервал для 02- Сравните результат с интервалом, полученным в а).
Таблица 6.6
t
wt
Щ
t
wt
Щ
t
wt
щ
1
1.73
8.65
9
5.06
2.87
17
3.15
4.72
2
1.94
4.82
10
2.81
5.29
18
1.92
7.45
3
3.05
2.67
11
4.43
3.31
19
2.26
6.21
4
4.17
2.67
12
3.19
5.44
20
6.18
2.64
5
2.52
2.58
13
2.23
6.80
21
2.07
8.55
6
1.71
8.07
14
2.06
8.25
22
8.39
2.60
7
1.95
8.83
15
3.33
3.44
23
2.75
6.25
8
2.57
5.54
16
2.12
7.80
24
6.10
2.70
в.7. В таблице 6.7 представлены данные о потребительских расходах С и располагаемом доходе % тридцати семей (долл.).
Таблица 6.7
Потребление
Доход
10700
10900
11200
12000
11400
11700
12100
13000
12300
12600
13200
14000
13000
13300
13600
15000
13800
14000
14200
16000
14400
14900
15300
17000
15000
15700
16400
18000
15900
16500
16900
19000
16900
17500
18100
20000
17200
17800
18500
21000
а) Проведите регрессию С на Yd и проверьте наличие или отсутствие гетероскедастичности.
б) Если в а) выявлена гетероскедастичность, осуществите коррекцию на гетероскедастичность.
6.8. Таблица 6.8 содержит данные об уровнях запасов I, объемов продаж 5 (млн. долл.) и процентные ставки по кредитам Я в 35 фирмах некоторой отрасли. Экономическая интуиция подсказывает, что I должно быть положительно связано с 5 и отрицательно с R.
а) Проведите регрессию I на 5 и R и тест на гетероскедастичность.
б) Если в а) выявлена гетероскедастичность, осуществите коррекцию на гетероскедастичность, предполагая, что дисперсия ошибки пропорциональна S2.
Таблица 6.8
Фирма
/
S
R
Фирма
I
S
R
1
10
100
17
19
15
122
И
2
10
101
17
20
15
123
11
3
10
103
17
21
15
125
И
4
11
105
16
22
16
128
10
5
11
106
16
23
16
128
10
6
11
106
16
24
16
131
10
7
12
108
15
25
17
133
10
8
12
109
15
26
17
134
9
9
12
111
14
27
17
135
9
10
12
111
14
28
17
136
9
11
12
112
14
29
18
139
8
12
13
ИЗ
14
30
18
143
8
13
13
114
13
31
19
147
8
14
13
114
13
32
19
151
8
15
14
116
12
33
19
157
8
16
14
117
12
34
20
163
7
17
14
118
12
35
20
171
7
18
15
120
11
6.9. Таблица 6.9
Год
М
ВНП
Год
М
ВНП
1960
23.2
506.0
1970
58.5
982.4
1961
23.1
523.3
1971
64.0
1063.4
1962
25.2
563.8
1972
75.9
1171.1
1963
26.4
594.7
1973
94.4
1306.6
1964
28.4
635.7
1974
131.9
1424.9
1965
32.0
688.1
1975
126.9
1528.1
1966
37.7
753.0
1976
155.4
1702.2
1967
40.6
796.3
1977
185.8
1899.5
1968
47.7
868.5
1978
217.5
2127.6
1969
52.9
935.5
1979
260.9
2368.5
Источник: D.Salvaton. Statistics and Econometrics, McGraw-Hill, 1982.
а) Проведите регрессию M на ВНП и на 5%-ном уровне значимости протестируйте гипотезу об отсутствии автокорреляции ошибок.
б) Если в а) гипотеза отвергается, проведите коррекцию на автокорреляцию.
6.10. Рассмотрим модель yt = 0xt + et, t = 1,2, ...,n, где 0, xt — скаляры, и предположим, что lim„_oo(l/rc) х} = а2, 1іт„_оо(1/п) EiU+i xtxt-e - a'cr2, где |a| < 1 и E(et) = 0, E(etet_e) = /?>S<72 при всех 3, где \р\ < 1.
а) Вычислите асимптотическую дисперсию МНК-оценки параметра 0, т.е. limn_oo nV(A5Ls).
б) Вычислите асимптотическую дисперсию оценки параметра 0, полученной с помощью обобщенного метода наименьших квадратов, и покажите что при а = р асимптотическая эффективность МНК- оценки равна (1 - р2)/(1 + р2).
6.11. Рассмотрим модель yt = 0xt + єt, t = 1 n, где E(et) =
0, E(e?) = ax2, E(ete5) = 0 при t ф s и ?Г=і x2 = n.
а) Покажите, что МНК-оцспка 0 параметра 0 является несмещенной, но неэффективной.
б) Покажите, что стандартная оценка дисперсии 0 смещена вниз по отношению к истинной дисперсии 0.
6.12. Уравнение yt — 0i + (hxt + ?t оценивается по следующим наблюдениям (см. таблицу 6.10):
Таблица 6.10
X
4
1
5
8
2
У
6
3
12
15
4
Известна функциональная форма гетероскедастичности: V(et) = а\ = а2х2. Вычислить оценки обобщенного метода наименьших квадратов параметров 0\, 02 и их стандартные отклонения.
6.13. В модели yt — 0xt + ?t (0, xt — скаляры и xt > 0) ошибки et образуют авторегрессию первого порядка: = p?t-i + щ, 0 < р < 1. Расходы домашних хозяйств в Нидерландах (см. продолжение в упражнении 12.15).
Введение. Традиционной задачей эмпирических исследований в микроэкономике является оценивание кривых Энгеля. Эрнст Энгель установил, что при увеличении дохода семьи доля расходов на питание уменьшается (закон Энгеля). В современных микроэкономических терминах это означает, что эластичность расходов на питание по доходу меньше единицы. (При этом говорят также, что еда является необходимым товаром, а не предметом роскоши.) Зависимость расходов на приобретение некоторого вида товара от доходов называется кривой Энгеля. В настоящее время принято, как правило, вместо дохода рассматривать полные расходы.
В этой серии упражнений мы будем изучать ежегодные расходы домашних хозяйств (household) на питание в зависимости от полных ежегодных расходов и некоторых других переменных на основании данных по расходам семей в Нидерландах.
Данные. Используются данные, полученные из архива журнала Journal of Applied Econometrics (expend.xls). Для наших целей мы взяли данные о годовых расходах на питание, отдых и другие товары за период с октября 1986 г. по сентябрь 1987 г. (427 наблюдений). Список переменных содержится в таблице 6.11.
Таблица 6.11
Переменная
Описание
/3
Расходы на питание одной семьи с октября 1986 г. по сентябрь 1987 г. в голландских гульденах
v3
Расходы на отдых с октября 1986 г. по сентябрь 1987 г. в голландских гульденах
totZ
Полные расходы с октября 1986 г. по сентябрь 1987 г. в голландских гульденах
prov
Провинция
reg
Регион
scl
Социальный класс (1 — нижний класс, ..., 5 — верхний класс)
nahm
Число членов семьи старше 11 лет
durb
Степень урбанизации (1 — маленькая деревня, ..., 13 — большой город)
nch06
Число детей младше 6 лет
nchlll
Число детей от 7 до 11 лет
nchl217
Число детей от 12 до 17 лет
nchl8
Число детей старше 18 лет
6.14.1. а) Вычислите суммарные статистики всех переменных. б) Вычислите корреляционную матрицу переменных /3, v3, totZ и nahm. Проинтерпретируйте результат. Соответствует ли он вашим ожиданиям?
Расходы на питание. Здесь мы изучим линейную модель для объяснения логарифма расходов на питание: If3 = 1п(/3). Мы рассмотрим также некоторую модель для объяснения доли расходов на питание.
6.14.2. а) Проведите парную регрессию If3 на ItotZ = ln(tot3). С ее помощью постройте 95%-ный двусторонний доверительный интервал для эластичности по доходу.
б) В регрессии п. а) не принимается во внимание размер семьи. Объясните, почему это может привести к смещенности оценки. Объясните, почему таким образом вы, возможно, переоцениваете эластичность по доходу.
6.14.3. а) Проведите регрессию IfZ на ItotZ, nahm, nch06, richlW и константу.
б) С ее помощью постройте 95%-ный двусторонний доверительный интервал для эластичности по доходу. Сравните ваш результат с результатом упражнения 6.14.2 а).
в) Проинтерпретируйте эффект включения в регрессию состава семьи.
г) Проверьте, отличается ли влияние детей в возрасте до 6 лет от влияния детей в возрасте от 7 до 11 лет.
д) Проверьте, зависит ли каким-нибудь образом влияние наличия детей от их возраста.
6.14.4. а) Добавьте переменную ItotZs = ItotZ • ItotZ в правую часть регрессионного уравнения упражнения 6.14.3 и проведите новую регрессию. Является ли переменная ltot3s значимой? Что она означает?
б) Воспользуйтесь полученными результатами для оценивания эластичности при различных уровнях дохода totZ.
в) Воспользуйтесь полученными результатами и/или дополнительными вычислениями для построения доверительного интервала для эластичности при totZ = 36000.
6.14.5. а) Постройте фиктивные переменные для каждой из 13 провинций. Проведите регрессию If3 на переменные, включенные в упражнении 6.14.2, и на двенадцать из тринадцати фиктивных переменных. Почему не следует включать все 13 фиктивных переменных? Проверьте (на 95%-ном доверительном уровне) совместную значимость эффекта провинции.
б) Проведите аналогичную процедуру с заменой провинций на социальные классы.
6.14.6. а) Воспользуйтесь стратегией «от общего к частному» для построения наиболее подходящей модели, объясняющей величину 1/3. Проинтерпретируйте ваш результат. Используйте выбранную вами модель в последующих упражнениях.
б) Оцените эластичность по доходу для различных уровней переменной tot3. Является ли еда необходимым товаром или предметом роскоши?
в) Постройте доверительный интервал для эластичиости по доходу при totz = 36000.
г) Постройте двусторонний 95%-ный доверительный интервал для прогнозного значения расходов на питание бездетной семьи из двух человек, принадлежащей среднему классу и проживающей в Амстердаме, если ее общие расходы составляют 50000 гульденов.
д) Нарисуйте график зависимости остатков регрессии от ItotZ. Какой вывод вы можете сделать относительно предположения о независимости ошибок и регрессора ItotS?
6.14.7. а) Постройте переменную sf3 = 100 • fZ/totZ (доля расходов на питание в общем бюджете, в %). Следуя процедуре упражнения 6.14.6, постройте наиболее подходящую модель для объяснения я/3.
б) Используя результаты п. а), оцеиите эластичность по доходу для различных значений totZ. Сравните с результатами, полученными в упражнении 6.14.6.
в) Нарисуйте график зависимости остатков регрессии от ItotZ. Какой вывод вы можете сделать?
6.14.8. Долю расходов на питание в общем бюджете можно рассматривать как отрицательный показатель благосостояния: более высокое значение этой доли соответствует более низкому благосостоянию семьи. Тогда «стоимость детей» можно измерить, ответив на следующий вопрос: какой дополнительный доход требуется семье с каждым новым ребенком, чтобы остаться на том же уровне благосостояния, т. е. чтобы иметь ту же долю расходов на питание в общем бюджете?
а) Воспользуйтесь результатами, полученными в упражнении 6.14.7, чтобы оценить стоимость одного ребенка в возрасте 12 лет, беря в качестве отправной точки бездетную семью из двух человек.
б) Вычислите стоимость (первого) ребенка в каждой возрастной группе. Сравните с п. а). Проинтерпретируйте результаты.
Расходы на питание и гетероскедастичность. В предыдущих упражнениях мы предполагали, что ошибки гомоскедастичны. Сейчас мы попытаемся ответить на вопрос, является ли эта гипотеза приемлемой. В тех случаях, когда ее целесообразно отвергнуть, мы будем исследовать модель с учетом гетероскедастичности.
6.14.9. В качестве отправной точки используется модель упражнения 6.14.6.
а) Вычислите остатки е в этой модели и постройте переменную 1п(е).
б) Проведите регрессию 1п(е) на все независимые переменные модели упражнения 6.14.6.
в) Проверьте совместную значимость всех переменных в б).
г) Объясните, почему этот тест можно рассматривать как тест на наличие экспоненциальной гетероскедастичности (о2 = ехр(®'а)), и проинтерпретируйте результат.
6.14.10. В качестве отправной точки используется модель упражнения 6.14.7.
а) С помощью теста Бреуша-Пагана проверьте гипотезу о гетероскедастичности вида о = /(х'а) с неизвестной функцией /.
б) С помощью теста Голдфилда-Квандта проверьте гипотезу о наличии гетероскедастичности типа <а возрастает с ростом Itoti*.
в) Проверьте гипотезу о наличии экспоненциальной гетероскедастичности, следуя той же схеме, что и в упражнении 6.14.9.
6.14.11. В качестве отправной точки используется модель упражнения 6.14.7, но теперь допускается наличие экспоненциальной гетероскедастичности (<т = exp(z'a))
а) Основываясь на результатах упражнения 6.14.10 в), выберите в качестве z подходящий подвектор вектора х.
б) Оцените а.
в) Примените метод взвешенных наименьших квадратов с весом exp(-z'a).
г) Сравните результаты с результатами упражнения 6.14.7.
6.15. Рассматриваются следующие данные из газеты «Из рук в руки» за период с декабря 1996 г. по сентябрь 1997 г., касающиеся стоимости однокомнатных квартир в юго-западной части Москвы. Данные содержатся в файле rooml.xls. В таблице 6.12 приведено описание переменных.
Упражнения
201
Таблица 6.12
Переменная
Описание
п
Номер по порядку
distc
Удаленность от центра, км
distm
Удаленность от метро, мин
totsq
Общая площадь квартиры, кв.м
kitsq
Площадь кухни, кв.м
livsq
Площадь комнаты, кв.м
floor
Этаж, 0 — первый или последний, 1
— нет
cat
Категория дома, 1 — кирпичный, 0 -
- нет
date
Дата рекламного объявления
price
Цена квартиры, тыс. долл.
а) Найдите среднее, стандартное отклонение и другие выборочные статистики переменных. Найдите коэффициенты корреляции переменных с ценой квартиры. Соответствуют ли полученные значения экономической интуиции?
б) Исследуйте значимость влияния различных факторов на цену квартиры. (Вы можете брать в качестве зависимой переменной цену квартиры, цену квадратного метра общей площади или их логарифмы.)
в) Есть ли существенная зависимость цены квартиры от расстояния до центра? От расстояния до метро? Как интерпретировать результаты?
г) Подберите модель, которая наилучшим способом прогнозирует цену квартиры по имеющимся данным. Проверьте наличие гетероскедастичности.
в.1в. Выборка состоит из 70 объявлений о продаже двухкомнатных квартир из газеты «Недвижимость» за сентябрь 1997 г. Были отобраны квартиры в окраинных районах Москвы (новостройки). Данные находятся в файле гоош2. xls, таблица 6.13 содержит описание переменных.
а) Найдите среднее, стандартное отклонение и другие выборочные статистики переменных. Найдите коэффициенты корреляции переменных с ценой квартиры. Соответствуют ли полученные значения экономической интуиции?
б) Исследуйте значимость влияния различных факторов на цену квартиры. (Вы можете брать в качестве зависимой переменной
Таблица 6.13
Переменная
Описание
п
Номер по порядку
price
Цена квартиры, тыс. долл.
totsq
Общая площадь квартиры, кв.м
livsq
Жилая площадь квартиры, кв.м
kitsq
Площадь кухни, кв.м
distm
Расстояние пешком до метро, мин
floor
Этаж, 0 — первый или последний, 1 — нет
cat
Категория дома, 1 — кирпичный, 0 — нет
tel
Телефон, 1 — есть, 0 — нет
lift
Лнфт, 1 — есть, 0 — нет
bale
Балкон, 1 — есть, 0 — нет
цену квартиры, цену квадратного метра общей площади или их логарифмы.)
в) Есть ли существенная зависимость цены квартиры от расстояния до метро? От наличия телефона? лифта? Как интерпретировать результаты?
г) Что «стоит дороже»: квадратный метр кухни, коридора или комнаты?
д) Подберите модель, которая наилучшим способом прогнозирует цену квартиры по имеющимся данным. Проверьте наличие гетероскедастичности.
6.17. (Arthur van Soest, Tilburg University) Файл wages.xls содержит данные о 75 мужчинах и 75 женщинах, работавших на полную ставку (не менее 4 дней в неделю в 1987 г.). Данные получены на основании опроса. В таблице 6.14 приведено описание переменных.
Вопросы для обсуждения
- Верно ли, что зарплата мужчин выше, чем зарплата женщин? Если да, то может ли это быть объяснено разницей в возрасте или образовании?
- Какова отдача от образования?
- Одинакова ли зависимость зарплаты от возраста для мужчин и женщин?
Упражнения
203
Таблица 6.14
Переменная
Описание
W
Зарплата, гульденов/час до вычета налогов (1987 г.)
AGE
Возраст, лет
SEX
Пол, 1 — для мужчин, 2 — для женщин
EDU
Уровень образования,
1 — начальная школа или менее;
2 — низшее ремесленное;
3 — среднее;
4 — высшее ремесленное;
5 — университет
а) Вычислите описательные статистики. Постройте матрицу корреляций.
б) Создайте переменную S = SEX - 1. Обсудите регрессию W = /За + 0iS + foAGE. Проделайте тест на гетероскедастичность. Получите оценку Уайта стандартных отклонений коэффициентов в МНК-оценивании. Проделайте двухшаговую процедуру коррекции на гетероскедастичность.
в) Обсудите регрессию W = /3q + 0iS+foAGE+foEDU. Что можно сказать о коэффициенте при 5 в этой и предыдущей регрессиях? Насколько реалистична эта модель?
г) Обсудите регрессию W = /Зо+ /3iS + faAGE + /33EDU + fa,AGE2. Что будет, если взять полулогарифмическую модель? При каком возрасте зарплата наибольшая? Зависит лн этот возраст от уровня образования? Как интерпретировать коэффициент при 5 в предыдущих регрессиях?
Еще по теме Упражнения:
- § 4. Фонетические упражнения
- § 4. Система! упражнений для обучения аудированию
- §5. Упражнения для обучения говорению
- ПРИЛОЖЕНИЕ В РЕШЕНИЯ И УКАЗАНИЯ К ЗАДАЧАМ И УПРАЖНЕНИЯМ 1.2
- Упражнения
- Упражнения 12.1.
- ДУХОВНЫЕ УПРАЖНЕНИЯ
- Духовные упражнения III Научиться умирать
- Упражнения
- Упражнения тела и духа