Теорвер и матстат 5ML осень 2021

Материал из CSC Wiki
Перейти к:навигация, поиск

5 курс (ВШЭ, МОиАД)

Чат курса: https://t.me/joinchat/Lc4-f1pzVVJkMmQy

Таблица с ведомостью

Преподаватели:

  • Зенкова Наталья (natalia.zenkova@jetbrains.com) (вопросы по лекциям и квизам)
  • Картышева Елена [1] (вопросы по практикам и домашкам)

Условия сдачи курса (теорвер)

  • Домашнее задание
  • Квизы
  • Письменный экзамен (задачи + теоретические вопросы)

Итоговый балл за модуль = 0.4*(баллы за дз)/(максимальное количество баллов за дз) + 0.2*(баллы за квизы)/(максимальное количество баллов за квизы) + 0.4*(баллы за экзамен)/(максимальное количество баллов за экзамен)


Итоговый балл за модуль переводится в итоговую оценку следующим образом:

  • 0.6 - 4.
  • 0.65 - 5.
  • 0.7 - 6.
  • 0.75 - 7.
  • 0.8 - 8.
  • 0.85 - 9.
  • 0.95 - 10.

Здесь приведены нижние границы для перевода в итоговую оценку. То есть 0.5985 будет переводится в итоговую 3, а не округляться до 4.

Итоговый балл за курс = 0.4*модуль1 + 0.6*модуль2

Лекции

Теория вероятностей

  1. Вероятностное пространство, понятие случайной величины, мера и вероятность
  2. Распределения случайных величин.
  3. Дискретные и абсолютно непрерывные распределения.
  4. Многомерные распределения, совместное распределение, независимость случайных величин.
  5. Числовые характеристики распределений: мат. ожидание, дисперсия, моменты высших порядков.

Математическая статистика

  1. Сходимость последовательностей случайных величин. Предельные теоремы.
  2. Введение в статистику. Определение выборки и основные числовые характеристики.
  3. Еще немного разговоров об основных числовых характеристиках. Выборочные характеристики как оценки генеральных.
  4. Среднеквадратическое отклонение (MSE), bias/variance tradeoff. Задача оценивания параметров. Точечное оценивание. Примеры построения оценок: метод выборочных характеристи, метод максимального правдоподобия. Несмещенность и состоятельность оценок.
  5. Свойства ОМП. Неравенство Рао-Крамера. Доверительные интервалы. Распределения, связанные с нормальным: распределение хи-квадрат, распределение Стьюдента. 4 точных доверительных интервала в случае нормальной модели. Асимптотический доверительный интервал для параметра распределения Бернулли. Асимптотический доверительный интервал для любого среднего из ЦПТ.
  6. Теорема Гливенко-Кантели, теорема Колмогорова. Проверка гипотез: постановка задачи, критерий, доверительная и критическая области, вероятности ошибок первого и второго рода, мощность критерия, пример.
  7. Состоятельность критерия. Общая схема построения критерия. Консервативный и радикальный критерии. Доверительный интервал при проверке гипотез (4 примера точных критериев для нормальной модели, асимптотический критерий (z-критерий), асимптотический критерий для проверки гипотезы о параметре распределения Бернулли). Двухвыборочный t-критерий для независимых выборок с известной дисперсией (равной и нет), двухвыборочный критерий в нормальной модели в случае, если дисперсии неизвестны, но равны, а выборки независимые. Welch t-test. Понятие pooled variance. P-value. Немного о критериях согласия: хи-квадрат, критерий Колмогорова-Смирнова, критерий Крамера-Смирнова-фон Мизеса.

Литература

1. Чернова Н.И., "Теория вероятностей".

2. Чернова Н.И., "Математическая статистика".

Практики

Правила игры

Сдача домашних заданий

Домашние задания необходимо сдавать на почту staistics.master.courses+hse21@gmail.com. Не забывайте в конце суффикс +hse21, иначе ваше домашнее задание не будет проверено.

В теме письма писать: Фамилия Имя, домашнее задание N.

Дедлайн: 9:00 в день пары (то есть среда). После дедлайна за домашнее задание не ставятся баллы.

Материалы с занятий и домашние задания

Дополнительные задачи:

Баллы за дополнительные задачи суммируются с баллами за домашки. Больше максимального балла за домашки получить нельзя.

Дополнительные задачи 1 (дедлайн 6.10, 23:59)

  1. Лекция 1. Семинар 1. Домашнее 1 (дедлайн 14.09, 23:59).
  2. Лекция 2. Семинар 2. Домашнее 2 (дедлайн 22.09, 12:00).
  3. Семинар 3. Домашнее 3 (дедлайн 29.09, 9:00).
  4. Лекция 4. Семинар 4. Домашнее 4 (дедлайн 13.10, 9:00).
  5. Семинар 5. Домашнее 5 (дедлайн 27.10, 9:00).
  6. Семинар 6. Домашнее 6 (дедлайн 3.11, 9:00).


Статистика:

Дополнительные задачи 2 (дедлайн 20.12, 9:00)

  1. Семинар 1. Домашнее 1 (в качестве домашнего необходимо прислать ноутбук .ipynb или файл RMarkdown с выполненным заданием) (дедлайн 10.11, 9:00).
  2. Семинар 2. Домашнее 2 (дедлайн 24.11, 9:00).
  3. Домашнее 3 (дедлайн 1.12, 9:00).
  4. Домашнее 4 (дедлайн 8.12, 9:00).
  5. Домашнее 5 (дедлайн 15.12, 9:00).