Size: a a a

2019 November 15

AN

Alibek Nurpeissov in Data Engineers
всем привет, вопрос по spark sql. У меня есть дата и время начало и конец как вывести время DATEDIFF выводит ток дни, года, кварталы, вопрос что можно использовать для минут, часов, секунд???
источник

OA

Oleg Agapov in Data Engineers
Alibek Nurpeissov
всем привет, вопрос по spark sql. У меня есть дата и время начало и конец как вывести время DATEDIFF выводит ток дни, года, кварталы, вопрос что можно использовать для минут, часов, секунд???
можно перевести в unix_timestamp(), потом можно просто вычесть и получить разность в секундах. дальше просто математика)
источник

AN

Alibek Nurpeissov in Data Engineers
хмм. попробую спасибо)
источник

OA

Oleg Agapov in Data Engineers
scala> df.withColumn("timestamp", unix_timestamp(col("created_at").cast("timestamp"))).show()
+--------------------+----------+
|          created_at| timestamp|
+--------------------+----------+
|2019-05-06T09:45:29Z|1557135929|
|2019-06-06T09:45:29Z|1559814329|
+--------------------+----------+
источник
2019 November 18

IP

Ilya Pribytkov in Data Engineers
источник

IP

Ilya Pribytkov in Data Engineers
ребята подскажите почему иплиситы с педалью спарковские стали не нужны
источник

IP

Ilya Pribytkov in Data Engineers
когда было все в классе без них не работало
источник

IP

Ilya Pribytkov in Data Engineers
а щас они почемуто не нужны, ктонибудь в курсе?
источник

EN

Eldar Nezametdinov in Data Engineers
имплиситы не просто так же, у тебя ничего не используется из них в объекте
в классе - используются кол и функции имортированы, имплиситы не требуются
источник

IP

Ilya Pribytkov in Data Engineers
Eldar Nezametdinov
имплиситы не просто так же, у тебя ничего не используется из них в объекте
в классе - используются кол и функции имортированы, имплиситы не требуются
ааа, вот значит что, я на col все поменял, и имплиситы стали не нужны, все понял, спасибо
источник

C

Combot in Data Engineers
Biggest Giveaways has been banned! Reason: CAS ban.
источник

AR

Andrey RRR in Data Engineers
есть какой нибудь скрипт или тулза позволяющая экспортировать участников групп вк в CSV файл?
источник

AR

Andrey RRR in Data Engineers
API вк нативно поддерживает такой экспорт?
источник

ME

Max Efremov in Data Engineers
Лучше изучить непосредственно API у ВК
источник

EN

Eldar Nezametdinov in Data Engineers
А есть какой-нибудь годный курс по ML Engineering?😒😒
(https://www.udacity.com/course/machine-learning-engineer-nanodegree--nd009t)
какая-то лажа с виду... а больше гугл не рекомендует ничего...
источник

AS

Andrey Smirnov in Data Engineers
Eldar Nezametdinov
А есть какой-нибудь годный курс по ML Engineering?😒😒
(https://www.udacity.com/course/machine-learning-engineer-nanodegree--nd009t)
какая-то лажа с виду... а больше гугл не рекомендует ничего...
источник

AS

Andrey Smirnov in Data Engineers
Eldar Nezametdinov
А есть какой-нибудь годный курс по ML Engineering?😒😒
(https://www.udacity.com/course/machine-learning-engineer-nanodegree--nd009t)
какая-то лажа с виду... а больше гугл не рекомендует ничего...
если к спарку, то есть такая книга
https://www.oreilly.com/library/view/advanced-analytics-with/9781491972946/
источник

EN

Eldar Nezametdinov in Data Engineers
спасибо
источник

AS

Anton Shelin in Data Engineers
отличная книга именно с практической точки зрения. только я ее читал еще в предыдущей инкарнации https://www.amazon.com/Hands-Machine-Learning-Scikit-Learn-TensorFlow/dp/1491962291
источник

ME

Max Efremov in Data Engineers
Подскажите, как лучше решить такую задачку: есть датафрейм, в котором около десятка миллионов строк. Нужно сохранить вывод в файлах по миллиону строк в каждом.
источник