Машинное обучение на практике

До упора практический начальный курс по машинному обучению. Полный цикл, от момента «у нас есть .xlsx файл и кто-то утверждает, будто в нём есть данные», через «получаем отличный и полезный результат», до «объясняем клиенту, что у него за данные и что за результат». Теория тоже будет, но без фанатизма. Ключевые слова вроде: классификация, регрессия, предсказания, ансамбли, - здесь есть и все их попробуем, но фокус будет на том, что есть данные и надо извлечь из них пользу.
Курс: EAS-025 new
Длительность: 24 ч.

Описание

Начало длинного и интересного пути по изучению машинного обучения. Вместо классического академического подхода «матстат – теория – дальше как-нибудь сами», с самого начала очень сильно ориентируемся на практику. Изучать, как именно работают алгоритмы, а тем более почему они работают вообще – здорово и полезно, но по мнению автора курса, делать это надо несколько позже. Когда дойдём до вопроса «круто, но давайте ещё лучше, что тут можно ещё подкрутить под капотом» -- обязательно к этому вернёмся.

А пока попробуем начать с самой жизненной постановки вопроса, когда есть кучи экселек вокруг и никакого понимания, что вообще можно делать и где тут волшебная Big Data, с которой так модно работать. Будем смотреть на данные, разбираться, что в них происходит, даже научимся объяснять это другим (графики и таблички!). Потом возьмём базовые классы задач, которые машинное обучение умеет решать, и собственно порешаем. Тоже с обязательным условием, что мы не просто хотим применить какую-то программу, а ещё и понять результат. И опять-таки объяснить его другим.

Тут скорее всего время курса и закончится, но если вдруг нет, то обсудим ваши максимально жизненные задачи и попробуем их формализовать до опробованных базовых задач. Потом будет крайне точное предсказание, какие технические грабли вы найдёте первыми (даже первую тройку), что с ними делать и как пытаться избежать.

И в конце всего сделаем маленький обзор, как много всего ещё можно попробовать, поделать и выучить на этом огромном поле машинного обучения.

Разбираемые темы

1. Обзор задачи (1 час).
  • Какие вещи хорошо решаются машинным обучением, какие им пытаются решать.
  • Что происходит, когда вместо Data Scientist ставят разработчика/аналитика/менеджера с ожиданием, что в процессе научится.

2. Подготовка, очистка, исследование данных (2 часа).
  • Как пережить состояние, в котором обычно приходят данные.
  • Порядок, в котором надо делать вещи из заголовка.
  • Что можно переложить на аналитиков, а что лучше копать самому.
  • Великое искусство не отвлекаться на гигантские проблемы со сбором и поставкой данных.

3. Классификаторы и Регрессоры (4 часа).
  • Много практики, решаем хорошо формализованные задачи с подготовленными данными.
  • Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перекидываем задачи в соседние формулировки.
  • Примеры, как более живые задачи вгоняются в обозначенные рамки.

4. Кластеризация (3 часа).
  • Чуть меньше практики, зато намного больше красивых картинок.
  • Огромное количество мест, где кластеризацию надо делать: исследование данных, проверка постановки задачи, проверки результатов.
  • Ещё больше мест, где её делать можно.

5. Что такое хорошо (2 часа).
  • Как оценивать результаты, как привыкли это делать клиенты.
  • Варианты объяснить непривычные оценки, варианты свести их к привычным.
  • Частные бессмысленные вопросы и что на них ответить.
  • Кросс-валидация и как её делать не надо; удивительные примеры оверфита и как он проникает в даже чуть небрежную архитектуру.

6. Куда можно улучшать модель (8 часов).
  • Что делает одну модель лучше другой: параметры, признаки, ансамбли.
  • Чуть-чуть про параметры, очень много про признаки, с практикой построения и соревнованиями.
  • Что делать, когда с признаками всё же переборщили (тоже с практикой, конечно же).
  • Взгляд в бездну инструментария для поиска лучших параметров/признаков/методов.

7. Графики, отчеты, работа с живыми задачами (4 часа).
  • Объясняем происходящее на пальцах: сначала себе, потом команде, потом клиенту.
  • Более красивые ответы на бессмысленные вопросы.
  • Как презентовать три терабайта результатов на одном слайде.
  • Полуавтоматические тесты, какие точки контроля процесса действительно нужны.
  • Распиливаем живые задачи в полный R&D процесс, крайне приветствуются варианты задач от аудитории.

Цели

  • Понять, какие задачи можно решать машинным обучением (и узнать, что Big Data это всего лишь подраздел, а не обязательное требование).
  • Научиться применять начальные методы машинного обучения и с помощью быстрого прототипирования научиться отвечать на вопрос «оценить реальную прибыль от возможного внедрения».
  • Подсветить, какие данные необходимо собирать и что может потребоваться от них в ближайшем будущем. Почему «хотим хранить петабайты» это не всегда просто прихоть.
  • Подготовится к более сложным темам, в частности – к полным решениям реальных сложных бизнес-задач.
  • Посмотреть, как именно машинное обучение стыкуется с классической аналитикой. В частности, убедиться, что не обязательно (и даже вредно) увольнять всех существующих аналитиков для внедрения концепции.

Целевая аудитория

Основная:
  • Аналитики
  • Менеджеры проектов, связанных с данными
  • Технические лидеры / ведущие разработчики в любых проектах, связанных с данными
  • Бизнес-аналитики
Дополнительная:
  • Разработчики
  • Инженеры данных (Data Engineer)
  • Архитекторы, системные проектировщики

Предварительная подготовка

Умение читать простой код на Python и писать на любом скриптовом языке.
После окончания курса выдаётся сертификат на бланке Luxoft Training
Тренер в Москва Онлайн
Водолагин Михаил Специалист по направлению Big Data
Ведущий программист и менеджер проектов, ориентированный на результаты, с разносторонним знанием финансовых рынков и практическим опытом в области количественных финансов и прикладной математики. Сильный послужной список ведущих команд для выполнения сложных проектов.
Водолагин Михаил Специалист по направлению Big Data
Ведущий программист и менеджер проектов, ориентированный на результаты, с разносторонним знанием финансовых рынков и практическим опытом в области количественных финансов и прикладной математики. Сильный послужной список ведущих команд для выполнения сложных проектов.
Данный курс запланирован в городах: Москва, Онлайн
12.10.2020 - 14.10.2020
Время: 10:00-18:00
Локация: Москва
Длительность: 24 ч.
Тренер
Водолагин Михаил
Специалист по направлению Big Data
37 000 1

12.10.2020 - 14.10.2020

17.06.2020 - 19.06.2020
Время: 10:00-18:00
Локация: Онлайн
Длительность: 24 ч.
Тренер
Водолагин Михаил
Специалист по направлению Big Data
-20% 37 000 1
29 600 1
В корзину
Не подходят даты, время или хотите заказать корпоративное обучение для команды?
+
Предложите свой вариант
17.06.2020 - 19.06.2020
Время: 10:00-18:00
Локация: Онлайн
Длительность: 24 ч.
Тренер
Водолагин Михаил
Специалист по направлению Big Data
-20% 37 000 1
29 600 1
В корзину

17.06.2020

Не подходят даты, время или хотите заказать корпоративное обучение для команды?
+
Предложите свой вариант
17.06.2020 - 19.06.2020
Время: 10:00-18:00
Локация: Онлайн
Длительность: 24 ч.
Тренер
Водолагин Михаил
Специалист по направлению Big Data
array (
  'datecoursestart' => '17.06.2020',
  'schedule_id' => '99752',
  'name' => 'Машинное обучение на практике',
  'schedule_city_id' => '14909',
  'startdate' => '17.06.2020 - 19.06.2020',
  'time' => '10:00-18:00',
  'duration' => '24',
  'price' => '37000',
  'schedule_discount' => 0,
  'course_id' => '99602',
  'course_code' => 'EAS-025',
  'cat_id' => '83007',
  'prepod_surname' => 'Водолагин',
  'prepod_code' => 'vodolagin',
  'prepod_short' => 'Специалист по направлению Big Data',
  'prepod_name' => 'Михаил',
  'prepod_photo' => 
  array (
    'ID' => '12816',
    'TIMESTAMP_X' => '13.01.2020 14:56:40',
    'MODULE_ID' => 'iblock',
    'HEIGHT' => '100',
    'WIDTH' => '100',
    'FILE_SIZE' => '16743',
    'CONTENT_TYPE' => 'image/jpeg',
    'SUBDIR' => 'iblock/5e3',
    'FILE_NAME' => 'vodolagin.jpg',
    'ORIGINAL_NAME' => 'vodolagin.jpg',
    'DESCRIPTION' => '',
    'HANDLER_ID' => NULL,
    'EXTERNAL_ID' => 'f096b3c0bbfe39e6f2aa23c481a423b1',
    '~src' => false,
    'SRC' => '/upload/iblock/5e3/vodolagin.jpg',
  ),
  'detail_page_url' => '/edu/catalog/course.html?ID=99752',
  'schedule_city' => 'Онлайн',
  'currency' => 'Рубли',
  'online_id' => NULL,
  'schedule_yes_basket' => NULL,
  'time_interval' => '',
  'CURRENCY_NEW' => ' 1',
  'discount' => 0,
  'discount_type' => NULL,
  'no_basket' => NULL,
  'schedule_course_sale' => '20',
)
-20% 37 000 1
29 600 1
В корзину
Не подходят даты, время или хотите заказать корпоративное обучение для команды?
+
Предложите свой вариант
Онлайн 37 0001

Записаться на курс

Выбрать дату
Если Вам не подходят дата и место проведения тренинга, Вы можете оставить заявку на участие в нем в любом из городов, где представлены филиалы Luxoft Training. Для этого выберите вариант "Открытая дата" и укажите желаемое место проведения курса.
Желаемое место проведения курса
Вы можете оставить заявку на корпоративное обучение сотрудников Вашей компании в любом городе России или Украины, выбрав вариант "Другой город"
Фамилия *

Имя *

Отчество

Контактный E-mail *

Компания *

Телефон *

Город *

Комментарий
Оценка и обучение ИТ-специалистов по ключевым направлениям разработки программного обеспечения. Курсы от экспертов-практиков по языкам программирования, системному и бизнес-анализу, управлению проектами, тестированию ПО, архитектуре ПО. Luxoft Training – единственный учебный центр в России, авторизованный IIBA. Действует скидка 10% на обучение физических лиц.
   Подпишись на ежемесячный DigestLT
Успешная форма подписки.
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.