Size: a a a

2021 November 03

AZ

Anton Zadorozhniy in Data Engineers
ради моего интереса, сколько строк и фич в этом скоринг джобе?
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну допустим 3000 фич и 1млрд строк
источник

ЕГ

Евгений Глотов... in Data Engineers
Даже меньше
источник

DZ

Dmitry Zuev in Data Engineers
лярд строк? китайский банк шоле?
источник

ЕГ

Евгений Глотов... in Data Engineers
Просто когда у вас появляется какой-то инструмент, вы можете решить задачу, когда у вас появляется удобный инструмент, вы можете перерешать кучу задач)
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну в банке например можно транзакции скорить на предмет отклонений
источник

ЕГ

Евгений Глотов... in Data Engineers
Подтыкая фичи клиента
источник

ЕГ

Евгений Глотов... in Data Engineers
Я думаю там можно и петабайты при желании набрать
источник

AZ

Anton Zadorozhniy in Data Engineers
обычно не ждут пока миллиард накопится, в таких случаях
источник

DZ

Dmitry Zuev in Data Engineers
тогда их не надо все целиком читать ваще
источник

ЕГ

Евгений Глотов... in Data Engineers
А если исторические решили посмотреть
источник

ЕГ

Евгений Глотов... in Data Engineers
За месяц миллиард транзакций не наберётся?
источник

DZ

Dmitry Zuev in Data Engineers
это лишь значит что у тебя bounded операция, ей не нужно всё в памяти
источник

ЕГ

Евгений Глотов... in Data Engineers
А кто говорит что нужно всё в памяти
источник

ЕГ

Евгений Глотов... in Data Engineers
Нужно поскорить)
источник

ЕГ

Евгений Глотов... in Data Engineers
На <RDBMS_name>)
источник

ЕГ

Евгений Глотов... in Data Engineers
На кликхаусе, например
источник

ЕГ

Евгений Глотов... in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
я-то целиком на вашей стороне если что, надо всегда выбирать технологию которая сможет отскейлится на все население Земли (умноженное на три), просто на всякий случай, это называется future proof!
источник

ЕГ

Евгений Глотов... in Data Engineers
Надо всегда выбирать технологию, с которой потом будут на спарк переписывать
источник