Фреймворк Apache Spark для разработчиков: продвинутый уровень

Тренинг даёт подробное представление о внутреннем устройстве и функционировании фреймворка Apache Spark – как Spark Core (RDD), так и Spark SQL и Spark Streaming.
Курс: EAS-024
Длительность: 24 ч.

Описание

Тренинг даёт подробное представление о внутреннем устройстве и функционировании фреймворка Apache Spark – как Spark Core (RDD), так и Spark SQL, Spark Streaming.и Spark Structured Streaming. Рассматриваются механизмы запуска компонентов кластера Spark под управлением разных менеджеров кластеров, управление выделением ресурсов (в первую очередь – памяти), механизмы работы планировщиков. Подробно исследуются преимущества формата внутреннего представления Tungsten и работы оптимизатора Catalyst. 

Разбираемые темы

  • Внутренняя архитектура Spark, Spark Runtime Environment

  • Настройка Spark Context, SparkConf

  • Внутреннее устройство RDD, логический план

  • Лучшие практики программирования с RDD

  • Физический план: работы, стадии, задачи

  • Планировщики и выполнение физического плана

  • Настройка памяти, сериализация, кеширование, сборка мусора

  • Datasource API, внутреннее представление данных Tungsten, форматы файлов

  • Оптимизатор Catalyst

  • Микропакетный Spark Streaming: получение и выдача данных

  • Structured Streaming: получение и выдача данных

Цели

  • Понимать внутреннее устройство Spark;
  • Понимать механизмы запуска и настройки компонентов Spark на разных кластерах (Standalone, YARN, Mesos);
  • Научиться оптимизировать программы, обрабатывающие RDD;
  • Понимать механизмы оптимизации программ на Spark SQL;
  • Понимать механизмы оптимизации программ, обрабатывающих потоковые данные, как в микропакетах, так и в Dataset.

Целевая аудитория

Разработчики, архитекторы

Предварительная подготовка

Опыт разработки на Java или Scala под Apache Spark от 3 месяцев. 
После окончания курса выдаётся сертификат на бланке Luxoft Training
-10% ФИЗИЧЕСКИМ ЛИЦАМ
Не подходят даты, время или хотите заказать корпоративное обучение для команды?
+
Предложите свой вариант
Москва 35 300 1
Санкт-Петербург 31 770 1
Омск 26 480 1
Киев 6 875 грн.
Одесса 6 200 грн.
Днепр 6 200 грн.

Рекомендуемые дополнительные материалы, источники:


  1. Mike Frampton. Mastering Apache Spark. – Packt, 2015. –  476 pp.

  2. Sandy Ryza et al. Advanced Analytics with Spark– O’Reilly, 2015. –261 pp. 

  3. Sumit Gupta. Learning Real-time Processing with Spark Streaming. – Packt, 2015. –  271 pp.

  4. Х. Карау и др. Изучаем Spark: молниеносный анализ данных. – М.: ДМК Пресс, 2015. – 304 с.

Записаться на курс

Выбрать дату
Если Вам не подходят дата и место проведения тренинга, Вы можете оставить заявку на участие в нем в любом из городов, где представлены филиалы Luxoft Training. Для этого выберите вариант "Открытая дата" и укажите желаемое место проведения курса.
Желаемое место проведения курса
Вы можете оставить заявку на корпоративное обучение сотрудников Вашей компании в любом городе России или Украины, выбрав вариант "Другой город"
Фамилия *

Имя *

Отчество

Контактный E-mail *

Компания *

Телефон *

Город *

Комментарий
По запросу на education@luxoft.com мы ответим на любые дополнительные вопросы касательно обучения в нашем Luxoft Training.
   Подпишись на ежемесячный DigestLT
Успешная форма подписки.
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.