Курс: EAS-021
Длительность: 24 ч.
Длительность: 24 ч.
Описание
DataStax Enterprise – коммерческий дистрибутив, построенный на основе Apache Cassandra, добавляющий возможности полнотекстового поиска (Solr), аналитической обработки данных (Spark) и работы с графами.Cassandra – распределенная отказоустойчивая масштабируемая нереляционная система управления базами данных, с равноправными узлами, очень быстрая на запись и просто быстрая на чтение, автоматически восстанавливающаяся при сбоях. Для доступа к данным имеется SQL-подобный язык. Курс посвящен изучению принципов, на которых она построена, методов создания баз данных для нее, написанию запросов на языке CQL и доступа к данным из прикладных программ.
Рассматриваются процессы чтения и записи данных, управления кластером, определения потребности в ресурсах, методы настройки производительности и мониторинга.
Разбираемые темы
- Основные концепции DataStax Enterprise;
- Модель данных Cassandra: Partitions, Clustering Columns;
- Архитектура одного узла: SSTable, пути записи и чтения, Compaction;
- Распределенная архитектура: узлы, управление кольцом DHT, Snitch, Gossip, несколько дата-центров;
- Репликация, согласованность копий, исправление рассогласованных копий;
- Снимки, резервные копии, импорт и экспорт данных, мониторинг, прочие вопросы обслуживания;
- Концептуальное и логическое моделирование данных, диаграммы Чеботко, правила и шаблоны отображения моделей;
- Физическое моделирование данных: репликация и согласованность, транзакции, агрегация, оптимизации;
- Программный доступ: язык CQL, DSE Java Driver;
- DSE Search: запросы, оценка документов, поисковый индекс, оптимизации;
- DSE Analytics: Spark-Cassandra Connector, Spark RDD, Spark SQL;
- DSE Graph: графовые схемы, моделирование графовых данных, Gremlin API, импорт/экспорт данных, выборки и перемещение по графу;
- DSE OpsCenter.
Цели
- понимать ключевые концепции и архитектуру DataStax Enterprise;
- проектировать модели данных для Cassandra;
- разрабатывать запросы на языке CQL;
- работать с данными Cassandra из программ на Java;
- обрабатывать в Spark данные, хранящиеся в Cassandra;
- использовать возможности полнотекстового и графового поиска в DSE.
Целевая аудитория
Разработчики, архитекторы, разработчики баз данных.Предварительная подготовка
Базовые навыки программирования на Java. Умение работать в командной оболочке Unix/Linux (bash). Опыт работы с базами данных желателен, но не обязателен.После окончания курса выдаётся сертификат на бланке Luxoft Training