Size: a a a

2019 November 14

AN

Alibek Nurpeissov in Data Engineers
Всем привет, вопрос в амбари  disk usage alert. Capacity Used: [95%, жреть больше всего non dfs как исправить это? Я просто не понимаю почему так жреть.
источник

A

Alex in Data Engineers
Зайти на машинку и посмотреть где ваше место ушло
источник

A

Alex in Data Engineers
Может кто-то активно логи пишет
источник

AN

Alibek Nurpeissov in Data Engineers
В данный момент не могу зайти( но я скину как будет возможность
источник

神風 in Data Engineers
Доброе утро. Подскажите, пожалуйста, умеет ли hive автоматически парсить схему из self-contained schema avro файлов?
источник

DM

Daniel Matveev in Data Engineers
神風
Доброе утро. Подскажите, пожалуйста, умеет ли hive автоматически парсить схему из self-contained schema avro файлов?
источник

神風 in Data Engineers
Жаль.. Я пока примерно так и делаю. Указываю схему, которую достаю из файла, в tblproperties
источник

神風 in Data Engineers
@optician_owl спасибо
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Nikita Ilin
У меня вопрос какой наиболее оптимальный способ выгрузки через jdbc. Если в вертике предположим 10 нод, я могу как-то сразу выгружать из 10 нод, или вертика всегда отдаёт только через одну?
Не можете, почитайте документацию
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Можете при jdbc использовать mars для ускорения на клиенте, но нужны шустрые диски или ссд
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Ну и не рекомендую заниматься такой херней, все таки вертика сама лучше агрегаты считает
источник

АЖ

Андрей Жуков in Data Engineers
А вроде у вертики есть прям спарк-коннектор
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Есть
источник

IP

Ilya Pribytkov in Data Engineers
всем привет вот в этой строке падает ошибка на строке .groupBy("CITY").avg("SALES") тоесть в колонке "SALES" лежат стринги, не знаю как скастить к интеджеру или даблу, кто знает подскажите пож
источник

M

Mi in Data Engineers
Ilya Pribytkov
всем привет вот в этой строке падает ошибка на строке .groupBy("CITY").avg("SALES") тоесть в колонке "SALES" лежат стринги, не знаю как скастить к интеджеру или даблу, кто знает подскажите пож
.withColumn("SALES_INT", df.SALES.cast(IntegerType))
источник

DM

Daniel Matveev in Data Engineers
Ilya Pribytkov
всем привет вот в этой строке падает ошибка на строке .groupBy("CITY").avg("SALES") тоесть в колонке "SALES" лежат стринги, не знаю как скастить к интеджеру или даблу, кто знает подскажите пож
источник

IP

Ilya Pribytkov in Data Engineers
что то ничего не понятно
источник

M

Mi in Data Engineers
Ilya Pribytkov
что то ничего не понятно
Намёк на то, что прежде чем что-то спрашивать в конфе проще сначала самому 10 секунд погуглить
источник

M

Mi in Data Engineers
а то получается что вы делегируете гуглёж на других людей
источник

DM

Daniel Matveev in Data Engineers
особенно если это касатеся очень базовых вещей
источник