Size: a a a

2020 October 23

N

Nikita Blagodarnyy in Data Engineers
тут wsl2 хвалили вчера
источник

ME

Mikhail Epikhin in Data Engineers
daria kibireva
Опытные коллеги, подскажите, пожалуйста, есть ли сейчас какие-то важные преимущества у windows pro по сравнению с windows home в решении стандартных задач дата-инженера? Раньше, например,  докер в  хоум с бубном toolbox приходилось устанавливать(сейчас это вроде уже не актуально) , есть  ли ещё какие-то подобные подвохи с инструментами?
нет, большой разницы нет, можно спокойно пользоваться
источник

AZ

Anton Zadorozhniy in Data Engineers
Алексей
Подскажите, кто-нить в hive настраивал pk и fk? Есть преимущества при последующем постороении планов? (типы выкидывания group by по pk, или откидывания join, если есть fk, но нет полей в select)
Там пилится потихоньку кучка фич вокруг этого (вот к примеру https://issues.apache.org/jira/browse/HIVE-20744), но пока драматического улучшения не ждите - до лучших домов далеко
источник

AZ

Anton Zadorozhniy in Data Engineers
Andrey Bel
Дарья привет, если есть желание работать ДЕ то желательно привыкать к линуксу, можно поставить второй системой
С WSL2 плюс-минус можно жить без дуалбута, я уже два месяца живу и все нормально
источник

А

Алексей in Data Engineers
Anton Zadorozhniy
Там пилится потихоньку кучка фич вокруг этого (вот к примеру https://issues.apache.org/jira/browse/HIVE-20744), но пока драматического улучшения не ждите - до лучших домов далеко
спс, думаю попробовать PK создать и посмотреть, уберется ли group by или count(distinct), а то у нас любят такое писать по первичному ключу
источник

dk

daria kibireva in Data Engineers
Andrey Bel
Дарья привет, если есть желание работать ДЕ то желательно привыкать к линуксу, можно поставить второй системой
Да, я про Линукс понимаю, но виндоуз все равно нужен для разных целей, сейчас просто есть возможность выбрать его версию. Спасибо
источник

dk

daria kibireva in Data Engineers
Anton Zadorozhniy
С WSL2 плюс-минус можно жить без дуалбута, я уже два месяца живу и все нормально
👍 спасибо
источник

AB

Andrey Bel in Data Engineers
daria kibireva
Да, я про Линукс понимаю, но виндоуз все равно нужен для разных целей, сейчас просто есть возможность выбрать его версию. Спасибо
А для каких если не секрет))
источник

AZ

Anton Zadorozhniy in Data Engineers
daria kibireva
👍 спасибо
там мб потребуется повозиться с GUI приложениями, вот мануал к примеру https://medium.com/@ragin/development-under-windows-under-linux-with-wsl2-intellij-860daf601b61
источник

dk

daria kibireva in Data Engineers
Andrey Bel
А для каких если не секрет))
Офис нужен
источник

AZ

Anton Zadorozhniy in Data Engineers
я пользуюсь вот этим Х сервером, на десктопе все нормально (я слышал на лаптопах бываю проблемы когда сеть переключается) https://x410.dev/
источник

dk

daria kibireva in Data Engineers
Благодарю, изучу)
источник

ЕГ

Евгений Глотов... in Data Engineers
Alexey Evdokimov
и если уж так невыносимо хочется докера, то всл2 можно юзать как бэкенд
А там нет проблем с сокетами? Что-то там очень сильно не работало где-то год назад по-моему
источник

AE

Alexey Evdokimov in Data Engineers
Евгений Глотов
А там нет проблем с сокетами? Что-то там очень сильно не работало где-то год назад по-моему
не замечал
источник

nn

nasdaq nice in Data Engineers
Привет ребят такой вопрос
допустим есть файл в hdfs размером в 2 блока и лежат там записи скажем json by line
и в конце файла есть запись которая не умеситлась в размер блока поэтому часть этой записи пошла во 2й блок
я читаю файл спарком в 2 потка и у меня в RDD получаются 2 партиции
вопрос сможет ли спарк корректно распарсить ту запись часть которой лежит на 1 и на 2 блоках?
источник

SO

Simon Osipov in Data Engineers
источник

АЖ

Андрей Жуков... in Data Engineers
>>> Был докладчиком на SmartData
но ведь она только в первый раз будет вроде
источник

N

Nikita Blagodarnyy in Data Engineers
Андрей Жуков
>>> Был докладчиком на SmartData
но ведь она только в первый раз будет вроде
в 17 была
источник

АЖ

Андрей Жуков... in Data Engineers
ух, точно
источник

SO

Simon Osipov in Data Engineers
Олды здесь?
источник