Size: a a a

2021 July 26

dz

dimka ztheshek in Data Engineers
спасибо, гляну
источник

AB

Andrey Bel in Data Engineers
у меня похожая тема года полтора назад - вышеописанные манипуляции помогли)
источник

N

Nikita Blagodarnyy in Data Engineers
Он не падает, он просто тупит. Ресурсов ему не хватает. Причём тут ноут, он и на сервере такое выдаёт, когда много тасков в очереди скопилось.
источник

dz

dimka ztheshek in Data Engineers
на сервере работает.
источник

dz

dimka ztheshek in Data Engineers
как бы затестить производительность
источник

AB

Andrey Bel in Data Engineers
ноут при том что когда он в режим сна переходит хартбит с сервера не проходит поэтому аф сам себя килит, пишет чет типо принят яд туда сюда🤣🤣🤣
источник

AB

Andrey Bel in Data Engineers
а на серваке тот же код работает и хоть бы что - вот при чем ноут)
источник
2021 July 27

SO

Simon Osipov in Data Engineers
https://h2oai.github.io/db-benchmark/

Тут во внутреннем чатике мелькнула статья про бенчмарки в некоторых базах данных. Что там есть: 500 MB, 5 GB и 50 GB объем данных, groupby и join операции. Пример на скриншоте.

This page aims to benchmark various database-like tools popular in open-source data science. It runs regularly against very latest versions of these packages and automatically updates. We provide this as a service to both developers of these packages and to users. You can find out more about the project in Efficiency in data processing slides and talk made by Matt Dowle on H2OWorld 2019 NYC conference.Efficiency in data processing slides and talk made by Matt Dowle on H2OWorld 2019 NYC conference.
источник

AS

Andrey Smirnov in Data Engineers
я правильно понимаю что всю эту бигдату он гонял на одной машине?
источник

AZ

Anton Zadorozhniy in Data Engineers
Да, это бенчмарк на одной машине
источник

AZ

Anton Zadorozhniy in Data Engineers
Причём практически десктопный (40 ядер, 128 гб)
источник

D

Dmitriy in Data Engineers
Киберпунк по идеи можно запустить
источник

AS

Andrey Smirnov in Data Engineers
ну для Мумбая это наверное норм, но тащить подобное в NY это уже нужно мужество
источник

AZ

Anton Zadorozhniy in Data Engineers
Бенч нормальный на самом деле, вопрос только зачем туда всякие Спарки и КХ притащили
источник

D

Dmitriy in Data Engineers
поч нет?
источник

AZ

Anton Zadorozhniy in Data Engineers
Это разные кейсы, обработка локально и на сервере/кластере, я не встречал команд которые ставили бы Спарк на локальную машину чтобы оно быстрее работало
источник

AS

Andrey Smirnov in Data Engineers
я бы посмотрел как у него кликхаус сделан, что он проиграл
источник

AZ

Anton Zadorozhniy in Data Engineers
Полезный тест
источник

D

Dmitriy in Data Engineers
ну да про спарк согласен
источник

N

Nikita Blagodarnyy in Data Engineers
невероятно. все же КХ на 128 гигов гоняют
источник