Машинное обучение на практике

До упора практический начальный курс по машинному обучению. Полный цикл, от момента «у нас есть .xlsx файл и кто-то утверждает, будто в нём есть данные», через «получаем отличный и полезный результат», до «объясняем клиенту, что у него за данные и что за результат». Теория тоже будет, но без фанатизма. Ключевые слова вроде: классификация, регрессия, предсказания, ансамбли, - здесь есть и все их попробуем, но фокус будет на том, что есть данные и надо извлечь из них пользу.
Курс: EAS-025 new
Длительность: 24 ч.

Описание

Начало длинного и интересного пути по изучению машинного обучения. Вместо классического академического подхода «матстат – теория – дальше как-нибудь сами», с самого начала очень сильно ориентируемся на практику. Изучать, как именно работают алгоритмы, а тем более почему они работают вообще – здорово и полезно, но по мнению автора курса, делать это надо несколько позже. Когда дойдём до вопроса «круто, но давайте ещё лучше, что тут можно ещё подкрутить под капотом» -- обязательно к этому вернёмся.

А пока попробуем начать с самой жизненной постановки вопроса, когда есть кучи экселек вокруг и никакого понимания, что вообще можно делать и где тут волшебная Big Data, с которой так модно работать. Будем смотреть на данные, разбираться, что в них происходит, даже научимся объяснять это другим (графики и таблички!). Потом возьмём базовые классы задач, которые машинное обучение умеет решать, и собственно порешаем. Тоже с обязательным условием, что мы не просто хотим применить какую-то программу, а ещё и понять результат. И опять-таки объяснить его другим.

Тут скорее всего время курса и закончится, но если вдруг нет, то обсудим ваши максимально жизненные задачи и попробуем их формализовать до опробованных базовых задач. Потом будет крайне точное предсказание, какие технические грабли вы найдёте первыми (даже первую тройку), что с ними делать и как пытаться избежать.

И в конце всего сделаем маленький обзор, как много всего ещё можно попробовать, поделать и выучить на этом огромном поле машинного обучения.

Разбираемые темы

1. Обзор задачи (1 час).
  • Какие вещи хорошо решаются машинным обучением, какие им пытаются решать.
  • Что происходит, когда вместо Data Scientist ставят разработчика/аналитика/менеджера с ожиданием, что в процессе научится.

2. Подготовка, очистка, исследование данных (2 часа).
  • Как пережить состояние, в котором обычно приходят данные.
  • Порядок, в котором надо делать вещи из заголовка.
  • Что можно переложить на аналитиков, а что лучше копать самому.
  • Великое искусство не отвлекаться на гигантские проблемы со сбором и поставкой данных.

3. Классификаторы и Регрессоры (4 часа).
  • Много практики, решаем хорошо формализованные задачи с подготовленными данными.
  • Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перекидываем задачи в соседние формулировки.
  • Примеры, как более живые задачи вгоняются в обозначенные рамки.

4. Кластеризация (3 часа).
  • Чуть меньше практики, зато намного больше красивых картинок.
  • Огромное количество мест, где кластеризацию надо делать: исследование данных, проверка постановки задачи, проверки результатов.
  • Ещё больше мест, где её делать можно.

5. Что такое хорошо (2 часа).
  • Как оценивать результаты, как привыкли это делать клиенты.
  • Варианты объяснить непривычные оценки, варианты свести их к привычным.
  • Частные бессмысленные вопросы и что на них ответить.
  • Кросс-валидация и как её делать не надо; удивительные примеры оверфита и как он проникает в даже чуть небрежную архитектуру.

6. Куда можно улучшать модель (8 часов).
  • Что делает одну модель лучше другой: параметры, признаки, ансамбли.
  • Чуть-чуть про параметры, очень много про признаки, с практикой построения и соревнованиями.
  • Что делать, когда с признаками всё же переборщили (тоже с практикой, конечно же).
  • Взгляд в бездну инструментария для поиска лучших параметров/признаков/методов.

7. Графики, отчеты, работа с живыми задачами (4 часа).
  • Объясняем происходящее на пальцах: сначала себе, потом команде, потом клиенту.
  • Более красивые ответы на бессмысленные вопросы.
  • Как презентовать три терабайта результатов на одном слайде.
  • Полуавтоматические тесты, какие точки контроля процесса действительно нужны.
  • Распиливаем живые задачи в полный R&D процесс, крайне приветствуются варианты задач от аудитории.

Цели

  • Понять, какие задачи можно решать машинным обучением (и узнать, что Big Data это всего лишь подраздел, а не обязательное требование).
  • Научиться применять начальные методы машинного обучения и с помощью быстрого прототипирования научиться отвечать на вопрос «оценить реальную прибыль от возможного внедрения».
  • Подсветить, какие данные необходимо собирать и что может потребоваться от них в ближайшем будущем. Почему «хотим хранить петабайты» это не всегда просто прихоть.
  • Подготовится к более сложным темам, в частности – к полным решениям реальных сложных бизнес-задач.
  • Посмотреть, как именно машинное обучение стыкуется с классической аналитикой. В частности, убедиться, что не обязательно (и даже вредно) увольнять всех существующих аналитиков для внедрения концепции.

Целевая аудитория

Основная:
  • Аналитики
  • Менеджеры проектов, связанных с данными
  • Технические лидеры / ведущие разработчики в любых проектах, связанных с данными
  • Бизнес-аналитики
Дополнительная:
  • Разработчики
  • Инженеры данных (Data Engineer)
  • Архитекторы, системные проектировщики

Предварительная подготовка

Умение читать простой код на Python и писать на любом скриптовом языке.
После окончания курса выдаётся сертификат на бланке Luxoft Training
Тренер в Онлайн
Водолагин Михаил Специалист по направлению Big Data
Ведущий программист и менеджер проектов, ориентированный на результаты, с разносторонним знанием финансовых рынков и практическим опытом в области количественных финансов и прикладной математики. Сильный послужной список ведущих команд для выполнения сложных проектов.
Данный курс запланирован в городах: Онлайн
12.10.2020 - 19.10.2020
Время: 14:00-18:00
Локация: Онлайн
Длительность: 24 ч.
Тренер
Водолагин Михаил
Специалист по направлению Big Data
37 000 руб.
9 900 грн.
В корзину

12.10.2020

12.10.2020 - 19.10.2020
Время: 14:00-18:00
Локация: Онлайн
Длительность: 24 ч.
Тренер
Водолагин Михаил
Специалист по направлению Big Data
37 000 руб.
9 900 грн.
В корзину
Не подходят даты, время или хотите заказать корпоративное обучение для команды?
+
Предложите свой вариант
Онлайн 37 000 руб.
9 900 грн.

Записаться на курс

Выбрать дату
Если Вам не подходят дата и место проведения тренинга, Вы можете оставить заявку на участие в нем в любом из городов, где представлены филиалы Luxoft Training. Для этого выберите вариант "Открытая дата" и укажите желаемое место проведения курса.
Желаемое место проведения курса
Вы можете оставить заявку на корпоративное обучение сотрудников Вашей компании в любом городе России или Украины, выбрав вариант "Другой город"
Фамилия *

Имя *

Отчество

Контактный E-mail *

Компания *

Телефон *

Город *

Комментарий
Оценка и обучение ИТ-специалистов по ключевым направлениям разработки программного обеспечения. Курсы от экспертов-практиков по языкам программирования, системному и бизнес-анализу, управлению проектами, тестированию ПО, архитектуре ПО. Luxoft Training – единственный учебный центр в России, авторизованный IIBA. Действует скидка 10% на обучение физических лиц.
   Подпишись на ежемесячный DigestLT
Успешная форма подписки.
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.