Size: a a a

2020 August 17

A

Alex in Data Engineers
изменять нельзя
источник

AZ

Anton Zadorozhniy in Data Engineers
evgeny afanasev
Ребят, всем привет. Изучаю сейчас hadoop через библиотеку одноименную для java. Понял как добавить файл, понял как удалить, как прочитать и сделать дерево файловой системы. А как можно изменить файл/дополнить ?
Каждый Append создаёт новый блок (даже если предыдущий был очень маленьким), с ним нужно аккуратнее
источник

ea

evgeny afanasev in Data Engineers
А, все. Кажется нашел туториал. Спасибо)
источник

SI

Sergey Ivanychev in Data Engineers
Знает кто-нибудь как во флинке настраивается параметр Non-Heap? Кажется, что это не taskmanager.memory.task.off-heap.size
источник

ДЗ

Денис Загитов... in Data Engineers
Ребят, есть у кого DMBOK на русском?
источник

АЖ

Андрей Жуков... in Data Engineers
я вот с удивлением узнал, что она на русском существует!
источник

ДЗ

Денис Загитов... in Data Engineers
ага, ребята из Юнидаты переводили
источник

SI

Sergey Ivanychev in Data Engineers
Денис Загитов
Ребят, есть у кого DMBOK на русском?
Это что за зверь?
источник

ДЗ

Денис Загитов... in Data Engineers
Книжка про управление данными на предприятии
источник

ДЗ

Денис Загитов... in Data Engineers
типа сборник стандартов в этой отрасли
источник

V

Vokeven in Data Engineers
Dmitry Girichev
Я вот смотрел курсеру - мне показалось там либо про дата сайнс, либо какой-то прям клауд-клауд, либо для новичков.
Может кто-нибудь может посоветовать достойные курсы по Data Engineering, можно и платные?
Мне понравился канал greatlearning на Youtube. Там индусы рассказывают. Я конкретно про Spark смотрел - вот прям все по полочкам разложил.
источник

V

Vokeven in Data Engineers
источник
2020 August 18

IK

Irina Kamalova in Data Engineers
а профессор Heather Miller не пополочкам рассклабывает?) https://www.coursera.org/learn/scala-spark-big-data
курс очень хорошо структурирован, а задания можно сдать бесплатно
источник

А

Алексей in Data Engineers
https://www.coursera.org/learn/big-data-analysis - еще такой от яндекса
источник

SS

Sergey Sheremeta in Data Engineers
Денис Загитов
Ребят, есть у кого DMBOK на русском?
источник

IK

Irina Kamalova in Data Engineers
Жмака
В scala user group мне также предложили вынести спарк сессию из бифор. В этом случае импот implocits сработал. Я оставил только афтер для закрытия сессии
тут уже ответили, но я еще советую с junit на ScalaTest перейти (как раз трейт бифор/афтер из этой библиотеки)
источник

GP

Grigory Pomadchin in Data Engineers
Жмака
А что в нем не так?
ну в скале есть тест библиотеки которые лучше junita
источник

GP

Grigory Pomadchin in Data Engineers
(на самом деле все будут лучше)
источник

AS

Andrey Smirnov in Data Engineers
да все они про одно и тоже, junit лучше поддерживается идеей, у меня часто в scalatest одиночные тесты не запускаются (при этом через sbt test все нормально)
источник

Ж

Жмака in Data Engineers
Я смотрел на scalatest и мне малое количество ассертов не понравилось. Но перейду на скаловские тесты. А мок тоже стоит скалы брать?
источник