Основы Greenplum для анализа данных

Курс посвящен изучению архитектуры и навыков работы с одной из самых мощных MPP-систем для построения хранилищ данных
Начальный уровень

Чему вы научитесь

  • Проектировать таблицы-ракеты: Выбирать такие ключи распределения, чтобы данные джойнились мгновенно и без перегрузки сети.
  • Качать данные терабайтами: Мастерски использовать gpfdist и PXF для максимально быстрой параллельной загрузки из файлов или облаков.
  • Видеть базу насквозь: Читать планы запросов (EXPLAIN), находить причины тормозов и понимать, куда и зачем «летают» данные между сегментами.
  • Укрощать статистику: Настраивать обслуживание через ANALYZE, чтобы оптимизатор никогда не ошибался.
  • Бороться с перекосами: Диагностировать и исправлять ситуации, когда один сервер работает за всех, а остальные простаивают.

О курсе

  • Проектирование: учимся распределять данные так, чтобы кластер работал на 100% мощности без перекосов.
  • Загрузка: осваиваем «скоростную трассу» для данных через gpfdist и облачные хранилища.
  • Оптимизация: учимся читать планы запросов, находить «бутылочные горлышки» и устранять лишние пересылки данных по сети.
  • Эксплуатация: автоматизируем сбор статистики и очистку базы, чтобы она не теряла скорость со временем.

Результат: вы умеете строить и поддерживать огромные хранилища, которые не тормозят.

Для кого этот курс

Курс идеально подойдет: Data-инженерам (DE): Чтобы строить быстрые ETL-процессы и проектировать архитектуру хранилищ (DWH), которая не «тормозит». Аналитикам данных: Чтобы понимать, как писать тяжелые SQL-запросы, которые будут выполняться секунды вместо часов. Архитекторам данных: Чтобы разобраться в преимуществах MPP-архитектуры и правильно внедрять Greenplum в ИТ-ландшафт компании.

Начальные требования

Минимальные требования: уверенное знание SQL и базовое понимание работы баз данных.

Наши преподаватели

Как проходит обучение

Проходит в комфортном для вас режиме, без дедлайнов в своем темпе изучаете, после теории будут тестовые задания по ключевым вопросам для закрепления.

Программа курса

загружаем...

Что вы получаете

  • Возможность использовать курс как шпаргалку
  • Понимание внутрянки Greenplum
  • Умение писать качественные запросы, а также качественное проектирование таблиц
  • Оптимизировать запросы
  • Работать со статистикой
  • Понимать различные типы таблиц

Сколько стоит обучение

Price: 1 590 
Вы попробовали и поняли, что вам сейчас не подходит этот курс? Ничего страшного, мы вернём вам деньги в течение 30-ти дней после покупки.

Часто задаваемые вопросы

Расскажите о курсе друзьям

Price: 1 590