• ОФОРМИТЬ ПОДПИСКУ ОТЗЫВЫ

👨‍💻 Программирование [BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

Gatsby

ВЕЧНЫЙ

Gatsby

ВЕЧНЫЙ
Регистрация
10 Окт 2018
Сообщения
36,295
Лайки
146,403
Автор: BigData Тeam
Название: Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

2023-11-13_05-43-08.png

Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]

Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:

  • подходы к Realtime-обработке;
  • гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
  • Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
  • архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
  • семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
  • отличия Key-Value хранилищ от реляционных БД;
  • компактификация и её виды, CQLSH;
  • архитектура Cassandra;
  • обеспечение надёжности и высокодоступности в Key-Value хранилищах;
  • интеграция Spark с Cassandra.
  • как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
  • trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
  • форматы данных в Big Data: ORC vs Parquet, Avro, ...
Подробнее:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скачать:
 
ВАЖНО:

Не оставляйте комментарии с просьбами обновить / заменить ссылку на скачивание или комментарии типа «404», «ошибка».

Для восстановления ссылки есть кнопки «Жалоба / Восстановить ссылку» в первом посте темы.

При нарушении Ваш комментарий будет удален, а Ваш аккаунт заблокирован на сутки. Пожалуйста, изучите правила нашего сайта.
Сверху Снизу