Data Science Deep Learning with NLP

Курс буде цікавим data science спеціалістам та спеціалісткам, що вже працюють з класичним NLP, але бажають покращити свою експертизу в сфері найбільш сучасних підходів вирішення NLP задач.

Про курс

Раніше у нас не було моделей, що могли б наслідувати природну мову, а тому якісне вирішення багатьох NLP завдань залишалося неможливим. Однак сьогодні майже будь-яку бізнес проблему можна ефективно вирішити за допомогою Deep Learning підходів. Глибокі нейронні мережі дозволяють створювати чатботів, які спілкуються з користувачами на тому ж рівні, що й живі люди. А ще — перекладають, знаходять та виправляють помилки в тексті, розпізнають іменовані сутності та ключові слова.

Саме завдяки Deep Learning підходам пошуковик так чітко розуміє ваші запити, а детектор плагіату ідентифікує крадений текст, навіть якщо ви замінили всі слова синонімами.

Курс буде цікавий Data Science спеціалістам та спеціалісткам, що вже працюють з класичним NLP, але бажають покращити свою експертизу у сфері найбільш сучасних підходів вирішення NLP завдань.

1 вересня 2021 курс триває 3 місяці
16 000 грн/міс 48 000 грн при повній оплаті курсу
16 800 грн/міс при оплаті частинами
25 студентів кожен студент отримує регулярний фідбек від кураторів групи

Кураторка

Галина Олійник

Ex-Head of Data Science department в 1touch.io. Має досвід в створенні end-to-end NLP рішень, що сфокусовані на аналізі даних для high-load систем з метою ідентифікації необхідних властивостей й подальшої трансформації текстових даних.



Програма курсу

Review of neural networks architectures: forward NNs, RNNs, CNNs, transformers.

Поговоримо про те, яким чином працюють найбільш популярні архітектури нейронних мереж та про те, які з них найчастіше використовуються в deep learning NLP моделях.

Language models: from Word2Vec to BERT.

N-gram language models, Word2Vec, GloVe, GPT-1 and GPT-2, BERT.

Named entity recognition: CRF vs. ELMo.

Розглянемо проблему розпізнавання іменованих сутностей з точки зору і статистичних моделей (PGMs), і глибоких нейронних мереж.

Text summarization: LexRank vs. attention-based NN.

Як створювати короткі саммарі тексту за допомогою класичних методів машинного навчання (LexRank) й складніших методологій (BERT).

Text similarity measurement: from string-based similarity to embedding-based similarity.

Вимірювання схожості текстів за допомогою різних підходів:
— string-based similarity;
— corpus-based similarity;
— knowledge-based similarity;
— hybrid similarity measures.

Machine translation: probabilistic models vs. deep NNs.

Поетапно розглянемо підходи до розв'язання проблеми автоматичного перекладу — від класичних моделей, що базуються на теорії ймовірності, до глибоких нейронних мереж.

Information extraction: keywords, topics and more.

Розпізнавання релевантної інформації в тексті за допомогою алгоритмів keywords extraction й topic modeling. Імплементація алгоритмів за допомогою класичних підходів (RAKE, LDA, etc.) і підходів Deep Learning.

Grammatical error correction: noisy channel modeling vs. transformers.

Класичні моделі та глибокі нейронні мережі для виправлення помилок в тексті.

Deep NNs deployment: TensorFlow vs. PyTorch vs. Hugging Face use cases.

Як найкраще передати модель в продакшн, як зробити її швидкою, ефективною та легко задеплоїти її, використовуючи найбільш популярні фреймворки Deep Learning.

Кому буде корисним цей курс

Data science спеціалістам / спеціалісткам

Щоб покращити навички вирішення NLP завдань за допомогою Deep Learning.

Комп’ютерним лінгвістам / лінгвісткам

Щоб заповнити прогалину у знаннях під час створення глибоких нейронних мереж в контексті NLP.

Cтудентам / студенткам технічних ВНЗ

Для поглиблення знань у сфері сучасних підходів до вирішення NLP завдань.

Час

8+ годин на тиждень на виконання домашніх завдань

Як відбувається навчання

Відеолекції та вебінари

Real-life завдання

У нас діє Practicult — культ практики. Тому ви будете робити багато складних домашок із реальних робочих буднів. Have fun & survive.

Курсовий проєкт

Під час курсу ви зробите великий проєкт. Адже принцип курсу — все як в житті.

Unlimited фідбек

У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від кураторів все. І так, десята ітерація — це нормально.

Сертифікат за справи

Видаємо лише тим, хто своїм потом, часом і силами його заслужив.

ГРАФІК

Старт занять

1 вересня

Мова викладання

українська

Запитання-відповіді

З яким софтом працюватимемо на курсі?

Anaconda, Zoom, Python (TensorFlow/PyTorch), Spacy, SKLearn

Які вимоги для вступу на курс?

— досвід від 1го року в Data Science;
— знання Python (middle)
— базове розуміння концептів Deep Learning
— бажаний досвід з NLP (basic text analysis)

Скільки всього буде занять?

Двічі на тиждень студенти отримуватимуть записи лекцій. Окрім цього, додаткове спілкування з кураторкою відбуватиметься на вебінарах раз на тиждень (всього їх буде 16).

Чи можна дивитися заняття в будь-який зручний день?

Можна, але важливо встигати виконувати домашні завдання, які ви будете отримувати після кожного заняття.

Що, якщо мені не сподобається?

До 3-го заняття ми зможемо повернути вам всю суму за навчання, якщо ви передумаєте.

Як відбувається комунікація на курсі та в якому форматі куратор дає фідбек?

Вся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Куратор надає фідбек у вигляді коментарів на домашні завдання і обговорення на вебінарах.

Чи будуть мені доступні відеозаписи лекцій після завершення курсу?

Так, у вас зберігається доступ після завершення курсу.

Чи отримаю я сертифікат після проходження курсу?

Тільки за умови виконання всіх домашніх завдань, а також успішного захисту курсового проекту.

Чи будуть записуватися вебінари?

Ми щоразу організовуємо запис, однак краще забронювати час, щоб приєднатися до онлайн-зустрічі — обговорити питання з одногрупниками та проконсультуватися з кураторами.

Реєстрація

Ще маєте питання?
Не соромтесь їх задати.

Проконсультуйте мене

Кому будет полезно