Data Science Time Series: Baseline

На курсі освоїмо фундамент, на якому будується весь Time Series.

Про курс

Прогнозування продажів, ефективності маркетингової стратегії, попиту на той чи інший товар та навіть детекція поз людини — ці завдання можна вирішити за допомогою Time Series (часових рядів).

Упродовж курсу зрозуміємо, що взагалі таке часові ряди. Дізнаємося фундаментальні принципи Time Series і навчимося працювати з необхідними бібліотеками. Будемо формувати й перевіряти гіпотези. Зрозуміємо, як адаптувати тези машинного навчання з інших дисциплін для роботи з Time Series.

На курсі студенти працюватимуть з кейсом від Fozzy Group. Після курсу отримаємо фундамент для роботи з часовими рядами та чітке розуміння сфер застосування Time Series.

3 вересня 2021 курс триває 3 місяці
10 000 грн/міс 30 000 грн при повній оплаті курсу
10 500 грн/міс при оплаті частинами
25 студентів кожен студент отримує регулярний фідбек від кураторів групи

Кураторка

Анна Вітюк

CEO та співзасновниця у Reactive Capital.



Програма курсу

Екскурс в математичну статистику

— Поняття безумовної та умовної ймовірності.
— Поняття ймовірнісних просторів, поняття розподілу ймовірності, середнього, дисперсії, стандартного відхилення, перекосу, ексцесу, довірчого інтервалу та їх приклади.

Типи завдань машинного навчання — регресія, класифікація, ранжування

— Природа випадкової величини, що моделюється (дискретна, безперервна).
— Гранична теорема у визначенні природи шуканої випадкової величини (у).
— Структура даних і різноманіття задач часового ряду; чим часовий ряд відрізняється від звичайної регресії / класифікації.
— Приклади датасетів.

Що таке часовий ряд

— Поняття дано, шукане і вікно прогнозу. Важливість підбору вікна прогнозу і його горизонту. Поняття довірчого інтервалу та ймовірносних просторів. Взаємозв'язок довірчого інтервалу ймовірності й горизонту вікна прогнозу.
— Уніваріантність і мультиваріантність часового ряду. Ендогенні й екзогенні ознаки.
— Порівняння завдань класичного машинного навчання і часового ряду. Рекурентна залежність шуканого від самого себе у часі в задачах часового ряду і NLP.

Моделі ARIMA й ознайомлення з бібліотекою statsmodels: ARMA, ARIMA, SARIMA, SARIMAX

— Порядки авторегресії, сезону, рухомого середнього, їх призначення та оптимальні значення.
— Підбір вікна прогнозу.

Поняття сезонності й огляд моделі SARIMA

Мультиваріантний часовий ряд з сезонною компонентою SARIMAX і без — ARIMAX.

Підбір гіперпараметрів для сімейства S/ARIMA/X

Введення в тест Акаіке.

Введення в машинне навчання для часового ряду

— Повторення основних тез машинного навчання з інших дисциплін, адаптація їх для задач часового ряду.
— Ознайомлення з бібліотекою scikit-learn, xgboost, catboost, lightgbm.
— Деревовидні та бустингові моделі.

Формування і перевірка гіпотез, статистичні тести з прикладами

Поняття крос-валідації для часового ряду, її особливості та приклади на scikit-learn.

Авторегресія та інженерія ознак. Поняття автокореляції

— Перевірка даних на автокореляції.
— Витяг лагів (shift, expanding) з сирих даних.
— Витяг множини ознак з єдиної величини — часові й автокореляційні.

Рухомі статистики для інженерії ознак

Поняття регресії до середнього на прикладі з лінійною регресією, поняття рухомої середньої та інших статистик, а також їх ймовірнісні перетини з шуканим (у).

Рекурентні нейронні мережі в задачах класифікації часового ряду

Приклади класифікації людської активності з використанням LSTM.

Cracking the Data Science deadline😱

— Автоматизація крос-валідації, підбору моделей і передпідготовки даних — бібліотека PyCaret.
— Прискорення розробки в кілька разів за допомогою автоматизації пайплайну.
— Швидка валідація гіпотез і прототипування моделей.
— Багаторазове підвищення ймовірності не тільки встигнути до дедлайну, але ще й здивувати вашого менеджера результатами ;)

Кому буде корисним цей курс

Програмістам

Програмістам з інших сфер, які розуміють Python (класи, функції) та мають хоча б базові знання із Pandas і NumPy.

Junior Data Scientist-ам

Початківцям в Data Science, які хочуть освоїти Time Series.

Час

8+ годин на тиждень на виконання домашніх завдань

Про навчання

Відеолекції і вебінари

Real-life завдання

У нас діє Practicult — культ практики. Тому ви будете робити багато складних домашок із реальних робочих буднів. Have fun & survive.

Unlimited фідбек

У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від кураторів все. І так, десята ітерація — це нормально.

Сертифікат за справи

Видаємо лише тим, хто своїм потом, часом і силами його заслужив.

ГРАФІК

Подача заявок

до 27 серпня

Мова викладання

українська

Запитання-відповіді

З яким софтом працюємо на курсі?

Pandas, Numpy, PyTorch, Keras, Stats Models

Які вимоги для вступу на курс?

— досвід від 1 року в Data Science;
— знання Python

Що, якщо мені не сподобається?

До 3-го заняття ми повернемо всю сумму за навчання, якщо ви передумаєте.

Як відбувається комунікація на курсі і в якому форматі куратор дає фідбек?

Вся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Куратор надає фідбек у вигляді коментарів на домашні завдання і обговорення на вебінарах.

Чи будуть доступні відеозаписи після закінчення курсу?

Так, у вас залишається доступ після завершення курсу.

Чи отримаю я сертифікат після проходження курсу?

Тільки за умови виконання всіх домашніх завдань, а також успішного захисту курсового проєкту.

Реєстрація

Ще маєте питання?
Не соромтесь їх задати.

Проконсультуйте мене

Кому будет полезно