Size: a a a

2021 April 22

ЕГ

Евгений Глотов... in Data Engineers
Хорошо хоть подписка была по гранту😆
источник

NN

No Name in Data Engineers
А это нельзя по каким-то причинам принести в он-прем?
источник

AZ

Anton Zadorozhniy in Data Engineers
Можно конечно
источник

AZ

Anton Zadorozhniy in Data Engineers
В конце концов, для сотрудника Амазона все что есть в AWS - это он-прем)
источник

NN

No Name in Data Engineers
Блин, логично)
источник

NN

No Name in Data Engineers
А вот с этим уже пробовали возиться? Стало лучше?
источник

ME

Max Efremov in Data Engineers
Emr может скейлиться
источник

ME

Max Efremov in Data Engineers
Если нагрузки нет, он может скукожиться до 2х нод, например
источник

AZ

Anton Zadorozhniy in Data Engineers
Это в самом начале пути, там помимо ярна приложения должны поддерживать эту парадигму (спарк не поддерживает)
источник

NN

No Name in Data Engineers
Понял. Буду следить.
источник

ПФ

Паша Финкельштейн... in Data Engineers
Переслано от Andrei Rebrov
free monitoring dashboard for Apache Spark https://github.com/datamechanics/delight
источник

GP

Grigory Pomadchin in Data Engineers
в спаме сегодня видел
источник

GP

Grigory Pomadchin in Data Engineers
уже попробовал? как оно?
источник

ПФ

Паша Финкельштейн... in Data Engineers
Не, десять секунд назад узнал об этой штуке. Выглядит хорошо
источник

А

Андрей in Data Engineers
Здравствуйте. Недавно переехали с хадупа хортонворкс на клаудеру, и из-за этого у нас изменилась версия хайв и спарка.
В хайве мы юзаем орк-файлы, и после переезда на клаудеру начались проблемы чтения с ними. При попытке выбрать все данные таблицы, записанной в орк, выдает nullpointerexception. Сказали, что это из-за старых версий орк-файлов и в таких случаях посоветовали установить опции convertMetastoreOrc: false и EnableVectorizedReader: true.
Но после этого датасет начал возвращать меньше данных, чем на самом деле есть в таблице.
источник

А

Андрей in Data Engineers
Подрзреваю, что более новые версии орк-файлов, которые были записаны позднее, либо игнорируются, либо читаются не полностью
источник

А

Андрей in Data Engineers
Может, кто-то в курсе, есть ли способ обойти эту проблему и избежать nullpointerexception каким-то иным способом?
источник

NN

No Name in Data Engineers
Я вот там прочитал, что UI и хистори-сервер не локальные, а предполагается только на их платформе это все смотреть. Если я все правильно понял, то я хз, кто этим будет пользоваться.
источник

GP

Grigory Pomadchin in Data Engineers
+ да было у мя на почте чёт; хотел тут банить уже а это Паша
источник

e

er@essbase.ru in Data Engineers
😒 да уж. Взять отладчик в зубы и написать свой патч.
источник