Теорвер и матстат 5ML осень 2021
5 курс (ВШЭ, МОиАД)
Чат курса: https://t.me/joinchat/Lc4-f1pzVVJkMmQy
Преподаватели:
- Зенкова Наталья (
natalia.zenkova@jetbrains.com
) (вопросы по лекциям и квизам) - Картышева Елена [1] (вопросы по практикам и домашкам)
Содержание
Условия сдачи курса (теорвер)
- Домашнее задание
- Квизы
- Письменный экзамен (задачи + теоретические вопросы)
Итоговый балл за модуль = 0.4*(баллы за дз)/(максимальное количество баллов за дз) + 0.2*(баллы за квизы)/(максимальное количество баллов за квизы) + 0.4*(баллы за экзамен)/(максимальное количество баллов за экзамен)
Итоговый балл за модуль переводится в итоговую оценку следующим образом:
- 0.6 - 4.
- 0.65 - 5.
- 0.7 - 6.
- 0.75 - 7.
- 0.8 - 8.
- 0.85 - 9.
- 0.95 - 10.
Здесь приведены нижние границы для перевода в итоговую оценку. То есть 0.5985 будет переводится в итоговую 3, а не округляться до 4.
Итоговый балл за курс = 0.4*модуль1 + 0.6*модуль2
Лекции
Теория вероятностей
- Вероятностное пространство, понятие случайной величины, мера и вероятность
- Распределения случайных величин.
- Дискретные и абсолютно непрерывные распределения.
- Многомерные распределения, совместное распределение, независимость случайных величин.
- Числовые характеристики распределений: мат. ожидание, дисперсия, моменты высших порядков.
Математическая статистика
- Сходимость последовательностей случайных величин. Предельные теоремы.
- Введение в статистику. Определение выборки и основные числовые характеристики.
- Еще немного разговоров об основных числовых характеристиках. Выборочные характеристики как оценки генеральных.
- Среднеквадратическое отклонение (MSE), bias/variance tradeoff. Задача оценивания параметров. Точечное оценивание. Примеры построения оценок: метод выборочных характеристи, метод максимального правдоподобия. Несмещенность и состоятельность оценок.
- Свойства ОМП. Неравенство Рао-Крамера. Доверительные интервалы. Распределения, связанные с нормальным: распределение хи-квадрат, распределение Стьюдента. 4 точных доверительных интервала в случае нормальной модели. Асимптотический доверительный интервал для параметра распределения Бернулли. Асимптотический доверительный интервал для любого среднего из ЦПТ.
- Теорема Гливенко-Кантели, теорема Колмогорова. Проверка гипотез: постановка задачи, критерий, доверительная и критическая области, вероятности ошибок первого и второго рода, мощность критерия, пример.
- Состоятельность критерия. Общая схема построения критерия. Консервативный и радикальный критерии. Доверительный интервал при проверке гипотез (4 примера точных критериев для нормальной модели, асимптотический критерий (z-критерий), асимптотический критерий для проверки гипотезы о параметре распределения Бернулли). Двухвыборочный t-критерий для независимых выборок с известной дисперсией (равной и нет), двухвыборочный критерий в нормальной модели в случае, если дисперсии неизвестны, но равны, а выборки независимые. Welch t-test. Понятие pooled variance. P-value. Немного о критериях согласия: хи-квадрат, критерий Колмогорова-Смирнова, критерий Крамера-Смирнова-фон Мизеса.
Литература
1. Чернова Н.И., "Теория вероятностей".
2. Чернова Н.И., "Математическая статистика".
Практики
Правила игры
Сдача домашних заданий
Домашние задания необходимо сдавать на почту staistics.master.courses+hse21@gmail.com
. Не забывайте в конце суффикс +hse21
, иначе ваше домашнее задание не будет проверено.
В теме письма писать: Фамилия Имя, домашнее задание N.
Дедлайн: 9:00 в день пары (то есть среда). После дедлайна за домашнее задание не ставятся баллы.
Материалы с занятий и домашние задания
Дополнительные задачи:
Баллы за дополнительные задачи суммируются с баллами за домашки. Больше максимального балла за домашки получить нельзя.
Дополнительные задачи 1 (дедлайн 6.10, 23:59)
- Лекция 1. Семинар 1. Домашнее 1 (дедлайн 14.09, 23:59).
- Лекция 2. Семинар 2. Домашнее 2 (дедлайн 22.09, 12:00).
- Семинар 3. Домашнее 3 (дедлайн 29.09, 9:00).
- Лекция 4. Семинар 4. Домашнее 4 (дедлайн 13.10, 9:00).
- Семинар 5. Домашнее 5 (дедлайн 27.10, 9:00).
- Семинар 6. Домашнее 6 (дедлайн 3.11, 9:00).
Статистика:
Дополнительные задачи 2 (дедлайн 20.12, 9:00)
- Семинар 1. Домашнее 1 (в качестве домашнего необходимо прислать ноутбук .ipynb или файл RMarkdown с выполненным заданием) (дедлайн 10.11, 9:00).
- Семинар 2. Домашнее 2 (дедлайн 24.11, 9:00).
- Домашнее 3 (дедлайн 1.12, 9:00).
- Домашнее 4 (дедлайн 8.12, 9:00).
- Домашнее 5 (дедлайн 15.12, 9:00).