Телеграмм чат группы hadoopusers страница 2863

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2007 membersпожаловаться на группу

2020 October 13

AZ

Anton Zadorozhniy in Data Engineers

А какие затраты? В людях например

две команды (чтобы покрывать шарик), человек по 12 чтоли было

источник

12:19пожаловаться #1

AZ

Anton Zadorozhniy in Data Engineers

клиентов немного, меньше сотни

источник

12:19пожаловаться #2

AZ

Anton Zadorozhniy in Data Engineers

но правда у нас была закрытая инсталляция, клиентам не давали особо трогать ничего

источник

12:20пожаловаться #3

UD

Uncel Duk in Data Engineers

Бесит что сообщество ( апач ) гоняется за новыми модными блестяшками, а на мердж патчей болт кладут

источник

12:21пожаловаться #4

AZ

Anton Zadorozhniy in Data Engineers

Бесит что сообщество ( апач ) гоняется за новыми модными блестяшками, а на мердж патчей болт кладут

эт нормально, все так делают

источник

12:22пожаловаться #5

UD

Uncel Duk in Data Engineers

Anton Zadorozhniy

эт нормально, все так делают

Ну как контрпример, система мейнтейнеров в линуксе

источник

12:23пожаловаться #6

UD

Uncel Duk in Data Engineers

Багфиксы быстро вливаются

источник

12:23пожаловаться #7

UD

Uncel Duk in Data Engineers

Потом бэкпорты в стабильные ядра

источник

12:24пожаловаться #8

AZ

Anton Zadorozhniy in Data Engineers

Ну как контрпример, система мейнтейнеров в линуксе

это LSF, у ASF другие стандарты

источник

12:24пожаловаться #9

UD

Uncel Duk in Data Engineers

В хайве тривиальный патч, с таргетом 3+

источник

12:24пожаловаться #10

UD

Uncel Duk in Data Engineers

Anton Zadorozhniy

это LSF, у ASF другие стандарты

Имхо, на все па с semantic versioning можно положить болт, если это решает проблемы сообщества

источник

12:25пожаловаться #11

AZ

Anton Zadorozhniy in Data Engineers

Имхо, на все па с semantic versioning можно положить болт, если это решает проблемы сообщества

это решает каждый конкретный проект

источник

12:26пожаловаться #12

UD

Uncel Duk in Data Engineers

Anton Zadorozhniy

это решает каждый конкретный проект

Или условная клаудера =)

источник

12:27пожаловаться #13

AS

Andrey Smirnov in Data Engineers

За две недели очень поел говна с ним и тезом, баги в джире есть 3+ года, на некоторые дажи патчи есть

а чем закончилась эта история с форком?

источник

12:28пожаловаться #14

UD

Uncel Duk in Data Engineers

а чем закончилась эта история с форком?

Пока ничем, я обложил костылями текущую версию хайва

источник

12:29пожаловаться #15

AZ

Anton Zadorozhniy in Data Engineers

я бы сказал что это нормальная история, в большинстве ASF проектов соотношение LOC/Contributors сильно больше чем у линукса или постгри, я бы тоже бежал вперед с таким ограниченным числом ресурсов

источник

12:29пожаловаться #16

AZ

Anton Zadorozhniy in Data Engineers

Sergey Sheremeta

однозначно Hoodie лучше DeltaLake OSS - как минимум из-за Merge-On-Read таблиц и поддержки глобальных индексов в Hbase/Cassandra (связь между первичным ключем данных и каталога партиции/субпартиции/субсубпартиции/бакета)

merge-on-read у айсберга в работе, еще не доступен в релизе (и это сильно сложнее, так как у айсберга подключаемые движки на запись, а не прибито гвоздями к спарку)

источник

12:31пожаловаться #17

R

Roman in Data Engineers

Anton Zadorozhniy

merge-on-read у айсберга в работе, еще не доступен в релизе (и это сильно сложнее, так как у айсберга подключаемые движки на запись, а не прибито гвоздями к спарку)

Вы частенько поднимаете тему с iceberg. Я правильно понимаю, что это что - то типа orc/parquet next gen, если очень грубо? Может у вас есть success story где - то описанный, было бы интересно почитать)

источник

12:39пожаловаться #18

AZ

Anton Zadorozhniy in Data Engineers

Вы частенько поднимаете тему с iceberg. Я правильно понимаю, что это что - то типа orc/parquet next gen, если очень грубо? Может у вас есть success story где - то описанный, было бы интересно почитать)

нет, iceberg/hudi/delta это скорее hive acid done right; orc/parquet это форматы хранения, они продолжают использоваться вместе с iceberg/hudi/delta

источник

12:42пожаловаться #19

AZ

Anton Zadorozhniy in Data Engineers

для большого success story with Iceberg еще рано (может быть у китайских товарищей), а мне врядли разрешат рассказать о моих проектах

источник

12:43пожаловаться #20