Курс: EAS-004
Длительность: 24 ч.
Длительность: 24 ч.
Описание
В рамках курса вы познакомитесь с основными понятиями и задачами, возникающими при создании хранилищ данных. Поймете, как цели влияют на выбор архитектуры и к каким последствиям может привести недостаточное внимание к компонентам. Составите представление о ролях и влиянии участников команды на результат.В программе курса будут описаны практические подходы к проектированию и внедрению хранилищ данных и его компонент. Вы рассмотрите управление жизненным циклом, включая вывод из эксплуатации и миграцию на новые системы, затронете темы управления данными и построения сервисов на их основе.
В практической части слушатели разобьются на две команды: одна из команд проработает проект по миграции хранилища данных с учетом стратегических целей развития предприятия, а вторая оценит его с точки зрения возможностей, ресурсов и сроков.
Разбираемые темы
1. Введение (теория + практика 2,5 часа).- Понятие «хранилище данных». Его возможности и ограничения
- Зачем создается DWH, какую бизнес-задачу оно решает
2. Компоненты и архитектура (теория + практика 3 часа).
- Классические подходы к проектированию хранилищ данных
- Типовые компоненты и протекающие процессы
- Концепции Инмона, Кимбалла и DataVault
- Обзор основных компонентов (stage, ods, dds, datamart, bi, metadata) и процессов (ETL, ELT, DQ, lineage)
3. Управление данными - Data Governance (теория + практика 2 часа).
- Общие и частные вопросы управления данными предприятия
- Информация рассматривается как актив, приносящий ценность и имеющий затраты на получение
- Концепция «мастер-данные» и системы по их управлению – MDM
4. Методики проектирования хранилищ (теория + практика 5 часов).
- Шаги проектирования хранилища
- Типовые приемы и инструментарий при создании
- Экспертиза участников и инфраструктуры
5. Область хранения исходных данных - Stage (теория + практика 3 часа).
- Потребность в хранении исходных данных из системы источника
- Типичные ошибки при организации данной области и ее отличие от «озера данных»
6. Области постоянного хранения - ODS и DDS (теория + практика 3 часа).
- Слои операционного и многомерного хранения данных
- Процессы извлечения, очистки, контроля и сохранения - ETL\ELT
- Трансформация в целевую схему хранения
7. Системы-потребители данных хранилища (теория + практика 3,5 часа).
- Типовые сценарии использования данных из хранилищ
- Основные потребители - системы бизнес-аналитики «BI»
- Устройство типовой БИ системы и причины их большого разнообразия
8. Новые вызовы в развитии хранилищ данных (теория + практика 2 часа).
- Обзор основных проблем, с которыми сталкиваются хранилища при росте
- Новые вызовы в области машинного обучения
- Концепция Data Mesh как альтернатива дальнейшего развития.
Цели
- Получить представление о роли и задачах хранилища данных в ИТ ландшафте предприятия.
- Освоить все этапы жизненного цикла DWH: от проектирования к внедрению, эксплуатации и выведению из сопровождения.
- Научиться избегать типовых ошибок при создании хранилищ и освоить методы и практики для успешного сопровождения хранилищ данных.
Целевая аудитория
Тренинг предназначен для:- архитекторов;
- технических лидеров и ведущих разработчиков;
- системных аналитиков и проектировщиков.
Также может быть интересным:
- инженерам по качеству данных (DQ);
- BI-специалистам (BI).
После окончания курса выдаётся сертификат на бланке Luxoft Training