Семинар¶
Задачи¶
Задача 1
Пусть модель
\(y_i \in \{0, 1\}\)
\(y_i^* = \beta_0 + \beta_1x_i + u_i\)
\(u_i \sim \mathrm{logit}\)
оценивается на четырёх наблюдениях:
\(y = [0, 1, 1, 0],\)
\(x = [20, 20, 30, 30].\)
[а] Выпишите функцию правдоподобия и опишите алгоритм нахождения \(\hat{\beta}_0\) и \(\hat{\beta}_1\).
[б] Найдите \(\hat{\mathrm{Var}}(\hat{\beta})\).
Задача 2
Исследователь Василий оценил логистическую регрессию на \(n = 10^7\) наблюдениях. Оказалось, что оценённая модель выглядит следующим образом:
\(\hat{p}(y_i = 1) = \Lambda(2.3 - 1.7x_i + 2.5z_i).\)
Василий также получил оценку ковариационной матрицы оценок коэффициентов:
\(\hat{\mathrm{Var}}(\hat{\beta}) = \hat{I}^{-1} = \begin{pmatrix}2.56 & 0.3 & -0.2 \\ 0.3 & 1.69 & 0.1 \\ -0.2 & 0.1 & 1.44\end{pmatrix}\)
[а] Проверьте гипотезу
против
на уровне значимости \(5\%\) при помощи теста \(W\).
[б] Проверьте гипотезу
против
на уровне значимости \(5\%\) при помощи теста \(W\).
[в] Проверьте гипотезу
против
на уровне значимости \(5\%\) при помощи теста \(W\).
[г] Найдите предельный эффект роста \(x_i\) на вероятность \(p(y_i = 1)\) в точке \(x_i = -0.5\), \(z_i = 2\).
Задача 3
Как известно, кленовый пекан бывает вкусным \(h_i = 1\) и невкусным \(h_i = 0\), а покемоны бывают ядовитыми \(v_i = 1\) и неядовитыми \(v_i = 0\). Отважный исследователь Степан составил следующую таблицу сопряжённости:
\(h_i = 1\), \(v_i = 1\) : \(n = 12\).
\(h_i = 0\), \(v_i = 1\) : \(n = 32\).
\(h_i = 1\), \(v_i = 0\) : \(n = 36\).
\(h_i = 0\), \(v_i = 0\) : \(n = 20\).
Степан использует логистическую регрессию \(p(v_i = 1) = \Lambda(\beta_0 + \beta_1h_i)\) для прогнозирования ядовитости покемонов.
[а] Найдите \(\hat{\beta}_0\) и \(\hat{\beta}_1\).
[б] Найдите \(\hat{p}(v_i = 1)\). Можно ли рассчитать эту величину без получения оценок коэффициентов?