Size: a a a

2020 September 04

А

Алексей in Data Engineers
возможно я тоже путаю, докой подтвердить не могу
источник

AZ

Anton Zadorozhniy in Data Engineers
кмк лучше разделять эти процессы, чтобы у оператора было понимание когда идет DML операция, а когда обсчет статистики
источник

А

Алексей in Data Engineers
это вносит непрозрачность, но дает в среднем больше плюсов
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry
хуже что сбор статистики тоже память жрет и может усугубить ситуацию. но в принципе ясно, волшебных кнопочек нет
у них вроде есть теперь сэмплинг статистики, мб попробовать его включить сначала https://docs.cloudera.com/documentation/enterprise/latest/topics/impala_perf_stats.html#experimental_stats_features
источник

MB

Maria B in Data Engineers
Ребята, привет! Кто может посоветовать 🔥опытного специалиста по администрированию Hadoop,находящегося в поиске работы в Мск?
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
админы хадупа не ищут работу, это работа их ищет - давно известный факт
источник

AZ

Anton Zadorozhniy in Data Engineers
находящиеся в поиске работы не связанной с Hadoop
источник

ПБ

Повелитель Бури... in Data Engineers
Maria B
Ребята, привет! Кто может посоветовать 🔥опытного специалиста по администрированию Hadoop,находящегося в поиске работы в Мск?
Вакансии можно сюда постить @datajobschannel
источник

С

Сюткин in Data Engineers
Админ хадупа должен крутиться как минимум на 3х работах одновременно
источник

S

Stanislav in Data Engineers
зачем?
источник

OA

Oleksandr Averchenko in Data Engineers
Stanislav
зачем?
Потому что хули там администрировать.
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
источник

N

Nata in Data Engineers
Простите, уже 4 минуты валяюсь под столом
источник

AS

Andrey Smirnov in Data Engineers
Oleksandr Averchenko
Потому что хули там администрировать.
+1 если чистый hadoop, но как правило ищут на всю бигдату, а там есть чем заняться, одна возня с сертификатами чего стоит
источник

PF

Polina Filatova in Data Engineers
Andrey Smirnov
+1 если чистый hadoop, но как правило ищут на всю бигдату, а там есть чем заняться, одна возня с сертификатами чего стоит
Да ладно
Хадуп же как ремонт, там всегда есть чем заняться и что улучшить
НА везде повключать, керберос, всяких либ математикам насобирать, новых апач покемонов в кластер затащить, подсказать пользователям что у них не работает
За это время ещё и кластер начинает расти и нагрузка
источник

PF

Polina Filatova in Data Engineers
Жабу обновить
источник

PF

Polina Filatova in Data Engineers
источник

EL

Evgeny Linnik in Data Engineers
Polina Filatova
Жабу обновить
Аналитиков учить дистинкты в Хайфе не писать...
источник

AZ

Anton Zadorozhniy in Data Engineers
Polina Filatova
Да ладно
Хадуп же как ремонт, там всегда есть чем заняться и что улучшить
НА везде повключать, керберос, всяких либ математикам насобирать, новых апач покемонов в кластер затащить, подсказать пользователям что у них не работает
За это время ещё и кластер начинает расти и нагрузка
всякие HA и krb наверное все-таки до того как пользователей пустят, разовая работа, там дальше надо следить за здоровьем, рулить ресурсами, приглядывать чтобы файлов мелких не плодили, учить пользоваться спарком поверх ярна - по сути технологическая нянька, от такой работы легко выгореть
источник