Size: a a a

2020 October 02

SS

Sergey Sheremeta in Data Engineers
JetBrains? я на коммьюнити все еще сижу (((
источник

SS

Sergey Sheremeta in Data Engineers
я роняя кал билдю из исходников parquet-mr, вечно все случается невовремя
источник

ME

Max Efremov in Data Engineers
Паша Финкельштейн
Можешь попробовать открыть нашими big data tools
Кстати, крутая штука, спасибо) Хадуп кластер тоже удобно мониторить)
источник

ПФ

Паша Финкельштейн... in Data Engineers
Max Efremov
Кстати, крутая штука, спасибо) Хадуп кластер тоже удобно мониторить)
Ееее! Если ты воткнёш на 5 звёзд будет вообще огонь
источник

ПФ

Паша Финкельштейн... in Data Engineers
Sergey Sheremeta
я роняя кал билдю из исходников parquet-mr, вечно все случается невовремя
Большой файл?
источник

SS

Sergey Sheremeta in Data Engineers
Паша Финкельштейн
Большой файл?
62 MB
источник

ПФ

Паша Финкельштейн... in Data Engineers
кинь мне, я потыкаю
источник

SS

Sergey Sheremeta in Data Engineers
Паша Финкельштейн
кинь мне, я потыкаю
послал в личку! спасибо!
источник

TT

Tsh Tsh in Data Engineers
Кто нибудь использует azure sqldw ? Возникли внезапные тормоза, сами майкрософтовцы не поймут в чем дело
источник

SS

Sergey Sheremeta in Data Engineers
гипотетически возможно, что причина битого паркет-файла в том, что я через
"yarn app -kill"
убил Spark-задание со Spark Streaming Context внутри?
источник

SS

Sergey Sheremeta in Data Engineers
тогда насколько я понимаю, ssc не должен был записать в чекпойнты что обработал порцию данных (оффсеты Кафки)
источник

SS

Sergey Sheremeta in Data Engineers
то бишь я могу дропнуть битый паркет и прогнать контрольную проверку по Кафке и по своим приземленным паркетам
источник

N

Nikita Blagodarnyy in Data Engineers
Андрей Жуков
Или хдфс нездоровится
похоже, что да. одна из NN какая-то хворая. свитчнул местами-все прошло.
источник

ПФ

Паша Финкельштейн... in Data Engineers
Sergey Sheremeta
гипотетически возможно, что причина битого паркет-файла в том, что я через
"yarn app -kill"
убил Spark-задание со Spark Streaming Context внутри?
Да, возможно. Это не грейсфул шатдаун, который может сломать что угодно
источник

ПФ

Паша Финкельштейн... in Data Engineers
Мы в ламоде специальный велосипед писали чтобы нормально останавливать стримингджобы
источник

K

KrivdaTheTriewe in Data Engineers
Sergey Sheremeta
гипотетически возможно, что причина битого паркет-файла в том, что я через
"yarn app -kill"
убил Spark-задание со Spark Streaming Context внутри?
модифицировали интерфейс юайки
источник

SS

Sergey Sheremeta in Data Engineers
Паша Финкельштейн
Мы в ламоде специальный велосипед писали чтобы нормально останавливать стримингджобы
можете поделиться алгоритмом велосипеда? файлы-маркеры в HDFS/S3, при появлении которых ssc делает грейсфул шатдаун?
источник

K

KrivdaTheTriewe in Data Engineers
и сделали копку шатдауна стримов
источник

K

KrivdaTheTriewe in Data Engineers
Sergey Sheremeta
можете поделиться алгоритмом велосипеда? файлы-маркеры в HDFS/S3, при появлении которых ssc делает грейсфул шатдаун?
прям как вы сказали было сделано
источник

SS

Sergey Sheremeta in Data Engineers
мне не нужно в UI, мне в CICD-флоу впихнуть нужно корректные редеплой стримов
источник