Size: a a a

2020 September 05

GP

Grigory Pomadchin in Data Engineers
Алексей
подскажите, у .par коллекций можно задать таймаут на выполнение кода в параллельном потоке?
Нет
источник

GP

Grigory Pomadchin in Data Engineers
хочешь эффекты - оборачивай в них а не пар используй (пытаюсь угадать что те надо, по-моему ты уже спрашивал что-то про пар а может не ты и я путаю)
источник

А

Алексей in Data Engineers
Grigory Pomadchin
хочешь эффекты - оборачивай в них а не пар используй (пытаюсь угадать что те надо, по-моему ты уже спрашивал что-то про пар а может не ты и я путаю)
В массиве список бд, к которым обращаюсь пачками в параллель и некоторые бд бывает зависают на отдаче
источник

А

Алексей in Data Engineers
Спасибо, получается лучше future
источник

GP

Grigory Pomadchin in Data Engineers
пар не пойдёт тут вообще
источник

А

Алексей in Data Engineers
Grigory Pomadchin
пар не пойдёт тут вообще
Зачем пар сделали такими удобными, если ими не стоит пользоваться ( 1 фраза, вместо нескольких строк)
источник

K

KrivdaTheTriewe in Data Engineers
его поэтому и вынесли в отдельную либу сейчас
источник

GP

Grigory Pomadchin in Data Engineers
Алексей
Зачем пар сделали такими удобными, если ими не стоит пользоваться ( 1 фраза, вместо нескольких строк)
на самом деле я давно ими не пользовался; они не очень удобные то в раельности, ничего не умеют
источник
2020 September 06

АБ

Александр Булатов... in Data Engineers
Привет. Как можно в hive на основе avro-схемы создать таблицу с форматом хранения Parquet, а не avro без лишних костылей типа создания таблицы при помощи like?
источник

K

KrivdaTheTriewe in Data Engineers
Александр Булатов
Привет. Как можно в hive на основе avro-схемы создать таблицу с форматом хранения Parquet, а не avro без лишних костылей типа создания таблицы при помощи like?
Create from select
источник

АБ

Александр Булатов... in Data Engineers
А одной командой никак?
источник

АБ

Александр Булатов... in Data Engineers
Придется же сначала таблицу создать с форматом avro, потом на её основе создать таблицу и старую удалить
источник

K

KrivdaTheTriewe in Data Engineers
Александр Булатов
Придется же сначала таблицу создать с форматом avro, потом на её основе создать таблицу и старую удалить
источник

АБ

Александр Булатов... in Data Engineers
Звучит костыльно
источник

АБ

Александр Булатов... in Data Engineers
Ладно, это в текущих реалиях одним скриптом отдал и забыл, даже зашаблонить можно. Спасибо
источник
2020 September 07

SS

Sergey Sheremeta in Data Engineers
коллеги! внезапно никто не настраивал глобальный индекс в HBase для Apache Hudi? как решали проблему зависимостей?
источник

RY

Ruslan515 Y in Data Engineers
Подскажите как работать с excel файлами больших размеров(50-100мб). Пробовал считать по частям с pd.read_excel(skip_rows=, nrows=).1я проблема) Долго загружает данные в ДФ.2я. после модификаций этих данных нужно записать их обратно в данный файл с сохранением изначального форматирования файла. вносил изменения через openpyxl. Но сохранить не получается - размер большой говорит
источник

С

Сюткин in Data Engineers
Ruslan515 Y
Подскажите как работать с excel файлами больших размеров(50-100мб). Пробовал считать по частям с pd.read_excel(skip_rows=, nrows=).1я проблема) Долго загружает данные в ДФ.2я. после модификаций этих данных нужно записать их обратно в данный файл с сохранением изначального форматирования файла. вносил изменения через openpyxl. Но сохранить не получается - размер большой говорит
Больших данных... я загружаю  каждый день эксельки по 100-120гб
источник

С

Сюткин in Data Engineers
источник

RY

Ruslan515 Y in Data Engineers
Сюткин
Больших данных... я загружаю  каждый день эксельки по 100-120гб
тогда подскажи как?)
источник