Learning Spark: Lightning-Fast Data Analytics (2020)
Авторы: Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee
Количество страниц: 400
Данное издание, обновленное для освещения версии Spark 3.0, показывает инженерам и специалистам по обработке данных, почему структура и унификация в Spark важны. В частности, в этой книге объясняется, как выполнять простой и сложный анализ данных и применять алгоритмы машинного обучения. С помощью пошаговых инструкций, фрагментов кода и ноутбуков вы:
✔️Изучите высокоуровневые структурированные API Python, SQL, Scala или Java;
✔️Почитаете общие сведения об операциях Spark и SQL Engine;
✔️Научитесь проверять, настраивать и отлаживать операции Spark с помощью конфигураций и пользовательского интерфейса;
✔️Подключитесь к источникам данных: JSON, Parquet, CSV, Avro, ORC, Hive, S3 или Kafka;
✔️Создадите надежные конвейеры данных с помощью Delta Lake и Spark с открытым исходным кодом;
✔️Разработаете конвейеры машинного обучения с помощью MLlib и произведете модели с помощью машинного обучения.
Достоинства:
➕Глубокое погружение в тему;
➕Подробные объяснения, включая установку.
Недостатки:
➖Не замечено.
Скачать книгу
#english #book #advanced