Size: a a a

2021 October 18

ЕГ

Евгений Глотов... in Data Engineers
Переслано от Dmitry Zuev
Даги на тысячи тасок тоже
источник

ЕГ

Евгений Глотов... in Data Engineers
Чистили базу ырфлоу?
источник

h

helby in Data Engineers
Ок, я не против

А материал годный не скинете по спарку?

В любом виде
источник

ЕГ

Евгений Глотов... in Data Engineers
Блин а ты чё на спарке не прогаешь?
источник

ЕГ

Евгений Глотов... in Data Engineers
Для чего тебе питон вообще
источник

ЕГ

Евгений Глотов... in Data Engineers
https://spark.apache.org/docs/latest/sql-data-sources-load-save-functions.html
Вот начни отсюда, там слева есть всё, что надо
источник

GP

Grigory Pomadchin in Data Engineers
Одерски хорошие курсы
источник

h

helby in Data Engineers
Ну для автоматизации разных вещей на работе)
источник

A

Aleksey in Data Engineers
👆 отличные варианты.
источник

РП

Роман Пашкевич... in Data Engineers
Господа DE, возможно задам глупый вопрос)
А на уровне HDFS, перекладывая файлики. Можно реализовать забор данных из одной таблицы по партиции (пусть будет партиция = месяц), и положить в другую таблицу с другой партицей (допустим - день)
источник

РП

Роман Пашкевич... in Data Engineers
Т.е. забрать данные то понятно что можно, это скопировать файл. А вот положить в другое партиционирование... ?
источник

ЕГ

Евгений Глотов... in Data Engineers
Нет, у тебя же колонка с днём внутри паркета например лежит, её оттуда надо считать из каждой записи, перепаковать паркеты и выкинуть
источник

РП

Роман Пашкевич... in Data Engineers
Ну да. Я так себе и представлял это.
источник

РП

Роман Пашкевич... in Data Engineers
Получается самый простой способ, это просто считать  данные. И сделать insert в другую таблицу по нужной партиции.
источник

ЕГ

Евгений Глотов... in Data Engineers
Кто-то пришёл и сказал тебе "да там изич переложить"?)
источник

РП

Роман Пашкевич... in Data Engineers
Да, типа того)) И еще типа "да там же файлики надо  переписать только")
источник

ЕГ

Евгений Глотов... in Data Engineers
Вот из дней сделать месяцы - реально
источник

ЕГ

Евгений Глотов... in Data Engineers
На чистом хдфс
источник

ЕГ

Евгений Глотов... in Data Engineers
Так как мы не добавляем информацию, а наоборот теряем
источник

ЕГ

Евгений Глотов... in Data Engineers
Вернее можно даже и не терять
источник