Size: a a a

Scala User Group

2021 January 21

AS

Alexey Shcherbakov in Scala User Group
Jorillo
достаточно раскомментить последний withColumn чтобы всё сломать
С этим в spark скорее и момент про не так быстро как хотелось, а какие были ожидания? Если мы говорим о Spark, то он на кластере стартовать минуту может, после чего час/два/три/и тд выполняться и для него это норма.
источник

J

Jorillo in Scala User Group
Oleg ℕizhnik
Если хотите, нужно выложить код в scastie.scala-lang.org
Очень важно сделать так, чтобы код компилировался, чтобы мы знали какие определения и библиотеки вы используете
Я так и не разобрался как со скасти работать, но зато разобрался со своим кодом, который выдаёт теперь ожидаемые результаты. Фиг его знает в чём конкретно была ошибка, но я переписал две функции упростив операции в них и всё заработало. Чисто теоретически ничего не поменялось, что имело бы отношение к добавлению нового столбца в датасет, но проблема куда-то ушла.
источник

J

Jorillo in Scala User Group
Alexey Shcherbakov
С этим в spark скорее и момент про не так быстро как хотелось, а какие были ожидания? Если мы говорим о Spark, то он на кластере стартовать минуту может, после чего час/два/три/и тд выполняться и для него это норма.
Я ожидал, что добавление бесполезного столбца ничего не изменит, так как этот столбец вообще нигде не используется. Но почему-то результат менялся.
источник

☭S

☭ ⤳ λ Shinkevich... in Scala User Group
Jorillo
Я ожидал, что добавление бесполезного столбца ничего не изменит, так как этот столбец вообще нигде не используется. Но почему-то результат менялся.
Вы даже не описали, как именно оно ломало весь код
источник

J

Jorillo in Scala User Group
☭ ⤳ λ Shinkevich
Вы даже не описали, как именно оно ломало весь код
У меня есть код, который делает некоторые рассчёты на датасете. Результат заранее известен, так что я могу точно сказать правильно ли работает мой алгоритм подсчёта.
Прикол был в том, что стоило добавить в датасет новый столбец, который не был никоим образом задействован в рассчётах и вообще никакого отношения не имел ни к чему, и исправный код ломался (т.е. производил неверный результат).
источник

GP

Grigory Pomadchin in Scala User Group
Jorillo
У меня есть код, который делает некоторые рассчёты на датасете. Результат заранее известен, так что я могу точно сказать правильно ли работает мой алгоритм подсчёта.
Прикол был в том, что стоило добавить в датасет новый столбец, который не был никоим образом задействован в рассчётах и вообще никакого отношения не имел ни к чему, и исправный код ломался (т.е. производил неверный результат).
спроси в @hadoopusers
но пример кода все же составь (хотя бы гист воспроизводимый)

в группе больше активных пользователей спарка (аналитика и тп)
источник

☭S

☭ ⤳ λ Shinkevich... in Scala User Group
Jorillo
У меня есть код, который делает некоторые рассчёты на датасете. Результат заранее известен, так что я могу точно сказать правильно ли работает мой алгоритм подсчёта.
Прикол был в том, что стоило добавить в датасет новый столбец, который не был никоим образом задействован в рассчётах и вообще никакого отношения не имел ни к чему, и исправный код ломался (т.е. производил неверный результат).
Могу только допустить, что у вас были вычисления завязанные на определенный порядок колонок
источник

GP

Grigory Pomadchin in Scala User Group
☭ ⤳ λ Shinkevich
Могу только допустить, что у вас были вычисления завязанные на определенный порядок колонок
скорее всего так
источник

J

Jorillo in Scala User Group
Grigory Pomadchin
спроси в @hadoopusers
но пример кода все же составь (хотя бы гист воспроизводимый)

в группе больше активных пользователей спарка (аналитика и тп)
В принципе я уже решил проблему, она куда-то сама собой рассосалась. Я вообще впервые сталкиваюсь со Скалой и Спарком, так что понятия не имею с какой стороны браться чтобы понять где была ошибка.
Могу скинуть свой багнутый код vs исправленный код, но сильно сомневаюсь что у меня хватит сейчас терпения и сил разобраться со scastie:(
источник

☭S

☭ ⤳ λ Shinkevich... in Scala User Group
Jorillo
В принципе я уже решил проблему, она куда-то сама собой рассосалась. Я вообще впервые сталкиваюсь со Скалой и Спарком, так что понятия не имею с какой стороны браться чтобы понять где была ошибка.
Могу скинуть свой багнутый код vs исправленный код, но сильно сомневаюсь что у меня хватит сейчас терпения и сил разобраться со scastie:(
Да хотя-бы чтоб понять, что там просходит с bucketedTrips
источник

J

Jorillo in Scala User Group
Переслано от Jorillo
источник

J

Jorillo in Scala User Group
вот багнутая версия
источник

J

Jorillo in Scala User Group
вот исправленная и дополненная версия
источник

J

Jorillo in Scala User Group
это полный проект, в котором сидит последняя иправленная версия (можно скомпилировать и запустить через ./test.sh)
источник

Oℕ

Oleg ℕizhnik in Scala User Group
Ну хоть узнали, что о спарке речь
источник

AB

Andrey Bel in Scala User Group
Oleg ℕizhnik
Ну хоть узнали, что о спарке речь
я не умничал с самого начала думал итак всем понятно)))
источник

AB

Andrey Bel in Scala User Group
думал вот вот в de чат отправят)
источник

J

Jorillo in Scala User Group
Oleg ℕizhnik
Ну хоть узнали, что о спарке речь
У меня стойкая ассоциация Scala == Spark🙂
источник

J

Jorillo in Scala User Group
Видимо, ошибочная
источник

AB

Andrey Bel in Scala User Group
не это правда точнее спарк это не только скала)
источник