High Performance Spark: Best practices for scaling and optimizing Apache Spark (2017)
Авторы: Holden Karau, Rachel Warren
#spark #book #advanced
Язык: английский.
Целевая аудитория: опытные разработчики.
Если вы слышали про большие данные или даже имели с ними дело, то, вероятнее всего, слышали про Hadoop, Apache Spark и другие системы и фреймворки, предназначенные для обработки колоссальных объемов данных в сети. Это руководство предназначено не только опытным разработчикам, но и тем, кто уже готов переходить на современные системы обслуживания данных, оно расскажет про основы фреймворка Apache Spark и особенности его использования.
В книге рассматриваются следующие темы:
✔ основы того, как работает Spark;
✔ датафреймы, датасеты и Spark SQL;
✔ джоины;
✔ работаем с хранилищами типа ключ-значение;
✔ тестирование и валидация и многое другое.
Преимущества:
➕ актуальный материал по теме;
➕ многочисленные примеры.
Недостатки:
➖ не замечено.