Семинар¶

Задачи¶

Задача 1: Теорема Гаусса-Маркова для стохастических регрессоров

Если

Модель задана как \(y = X\beta + u\), и при помощи МНК оценивается линейная регрессия \(\hat{y} = X\hat{\beta}\).
\(\beta\) – вектор констант.
\(P(\){у матрицы \(X\) есть линейно зависимые столбцы}\() = 0\).
\(E(u | X) = 0\), \(\mathrm{Var}(u | X) = \sigma^2 I\),

то

\(\hat{\beta}\) существуют и единственны с вероятностью один.
\(\hat{\beta}\) линейны по \(y\).
\(E(\hat{\beta} | X) = \beta\).
\(\hat{\beta}\) эффективны в классе линейных по \(y\) и условно несмещённых оценок.

А теперь – задача.

[а] Покажите, что если предпосылки ТГМ со стохастическими регрессорами выполнены, то оценки \(\hat{\beta}\) являются состоятельными.

[б] При нарушении какого условия ТГМ оценки МНК перестанут быть состоятельными?

Задача 2: Причины эндогенности

[a] Рассмотрим модель \(y_i = \beta x_i + u_i\) со стохастическими регрессорами, в которой выполнены все предпосылки ТГМ, кроме \(E(u_i | X) \ne 0\) по какой-то причине. Покажите, что если оценивается регрессия \(\hat{y}_i = \hat{\beta}x_i\) при помощи МНК, то \(\hat{\beta}\) не являются состоятельными.

[б] (Пропущенные переменные) Рассмотрим модель \(y_i = \beta x_i + \gamma z_i + u_i\) со стохастическими переменными, в которой выполнены все предпосылки ТГМ. Исследователь Дорофей оценивает регрессию \(\hat{y}_i = \hat{\beta}x_i\) при помощи МНК. Покажите, что оценки в регрессии Дорофея не являются состоятельными.

[в] (Ошибки измерения) Отчаянный исследователь Афанасий пытается предсказать результаты контрольной по статистике при помощи модели со стохастическими регрессорами \(y_i = \beta x_i + u_i\), где \(x_i\) – количество съеденных бургеров известной фирмы. Для сбора данных производится опрос студентов. Афанасий догадывается, что полученные данные отражают не настоящие \(x_i\), а строятся следующим образом:

\(x_i^* = x_i + \alpha + v_i,\)

где \(\alpha\) – показатель русской народной скромности, а \(v_i\) – случайная величина, отражающая несовершенство человеческой памяти. Предположим, что \(\alpha\) – константа, а \(E(x_i) = \mu_x\), \(E(u_i) = 0\), \(E(v_i) = 0\), \(\mathrm{Var}(x_i) = \sigma^2_x\), \(\mathrm{Var}(u_i) = \sigma^2_u\), \(\mathrm{Var}(v_i) = \sigma^2_v\). Предположим, что \(x_i\) не коррелирует с \(v_i\) и \(u_i\), а все \(u_i\) и \(v_i\) не коррелируют друг с другом и между собой.

Афанасий оценивает регрессию \(\hat{y}_i = \hat{\beta} x^*_i\) при помощи МНК по собранным данным. Покажите, что \(\hat{\beta}\) не является состоятельной. Как смещение зависит от \(\alpha\)?

Задача 3: Двухшаговый МНК

Переменные \(z_i\) называются инструментальными, если

(релевантность) \(E(x_iz_i) \ne 0 \sim \mathrm{cov}(x_i, z_i) \ne 0 \sim \mathrm{plim}_{n \to \infty} Z'_jX \ne 0\).
(валидность) \(E(u_iz_i) = 0 \sim \mathrm{cov}(u_i, z_i) = 0 \sim \mathrm{plim}_{n \to \infty} Z'_ju = 0\).

Если подобрали подходящие инструменты, то можно применить двухшаговый МНК:

Шаг 1. Оценить регрессию \(X\) на \(Z\), получить прогнозы \(\hat{X}\).

Шаг 2. Оценить регрессию \(y\) на \(\hat{X}\), получить оценки \(\hat{\beta}_{2SLS}\).

[а] Выведите оценки двухшагового МНК в общем случае (\(Z\) имеет размеры \(n\times m\), \(m \ge k\)).

[б] Выведите оценки метода инструментальных переменных (\(Z\) имеет размеры \(n\times m\), \(m = k\)).

[в] Покажите, что оценки метода инструментальных переменных являются состоятельными.

Прикладная статистика в машинном обучении

Семинар¶

Задачи¶