Size: a a a

Scala User Group

2020 August 16

Oℕ

Oleg ℕizhnik in Scala User Group
Ну в моей системе восприятия, этот глагол соотносится с алгеброй, т.е. я бы скорее к монаде его применил
источник

GP

Grigory Pomadchin in Scala User Group
тут согласен с тобой
источник

Ж

Жмака in Scala User Group
Всем привет. Новичок в скале 😇Не могу победить сериализацию. Создал тест класс с junit, в @before определил sparkSession, в тестовом методе нужно создать dataset из sequence с тестовыми даннымми. Создает датасет с одной колонкой value с бинарными данными. Имплиситс не могу прописать, потому что sparkSession определена в @before. Как правильно сделать? Пробовал энкодер сделать но видно "руки кривые" или туплю🙂
источник

GP

Grigory Pomadchin in Scala User Group
Жмака
Всем привет. Новичок в скале 😇Не могу победить сериализацию. Создал тест класс с junit, в @before определил sparkSession, в тестовом методе нужно создать dataset из sequence с тестовыми даннымми. Создает датасет с одной колонкой value с бинарными данными. Имплиситс не могу прописать, потому что sparkSession определена в @before. Как правильно сделать? Пробовал энкодер сделать но видно "руки кривые" или туплю🙂
сессию спарковую тебе не надо в бефор секции определять; просто как поле класса создай ее
источник

Ж

Жмака in Scala User Group
Grigory Pomadchin
сессию спарковую тебе не надо в бефор секции определять; просто как поле класса создай ее
Пробовал и так. Все равно имплиситс не берутся через импорт
источник

ФМ

Федор Мануковский... in Scala User Group
Жмака
Всем привет. Новичок в скале 😇Не могу победить сериализацию. Создал тест класс с junit, в @before определил sparkSession, в тестовом методе нужно создать dataset из sequence с тестовыми даннымми. Создает датасет с одной колонкой value с бинарными данными. Имплиситс не могу прописать, потому что sparkSession определена в @before. Как правильно сделать? Пробовал энкодер сделать но видно "руки кривые" или туплю🙂
Можно вообще вот так
https://github.com/holdenk/spark-testing-base
источник

GP

Grigory Pomadchin in Scala User Group
Жмака
Пробовал и так. Все равно имплиситс не берутся через импорт
что значит не берутся
источник

GP

Grigory Pomadchin in Scala User Group
можешь SharedSparkSession заэкстендить, тоже в тестах используется
источник

Ж

Жмака in Scala User Group
Когда пишу  импорт sparksession.implicits._ все равно создает колонку бинарную по имени  value
источник

Ж

Жмака in Scala User Group
Grigory Pomadchin
можешь SharedSparkSession заэкстендить, тоже в тестах используется
То есть трейт wrapper со спарк сессией?
источник

GP

Grigory Pomadchin in Scala User Group
Жмака
Когда пишу  импорт sparksession.implicits._ все равно создает колонку бинарную по имени  value
у тебя проблема что ты что-то в датасет суёшь (что?) и оно у тебя как массив бинарный ооьражантся а не как ожидаемое ‘нечто’?
источник

GP

Grigory Pomadchin in Scala User Group
Больше похоже что у тебя кодеков нет
источник

GP

Grigory Pomadchin in Scala User Group
Жмака
То есть трейт wrapper со спарк сессией?
не знаю насколько это Wrapper просто трейт с сессией
источник

Ж

Жмака in Scala User Group
Grigory Pomadchin
у тебя проблема что ты что-то в датасет суёшь (что?) и оно у тебя как массив бинарный ооьражантся а не как ожидаемое ‘нечто’?
Да. У меня есть данные, которые надо сравнить с получаемым датасетом из паркета.
источник

Ж

Жмака in Scala User Group
Grigory Pomadchin
Больше похоже что у тебя кодеков нет
Я тоже так предполагаю, потому что явно десериализация нужна. Как, не понимаю
источник

GP

Grigory Pomadchin in Scala User Group
Жмака
Я тоже так предполагаю, потому что явно десериализация нужна. Как, не понимаю
Не нужна явно, у тебя наверное какие нибудь крайо кодеки в скоупе приоритетно находятся
источник

Ж

Жмака in Scala User Group
Убирал тоже. Тоже самое получаю
источник

GP

Grigory Pomadchin in Scala User Group
по дефолту кинет ошибку что не может сериализовать то для чего нет кодеков
источник

Ж

Жмака in Scala User Group
Сейчас никакого крайо нет
источник

GP

Grigory Pomadchin in Scala User Group
ну ты попробуй просто пример сунь в датафрейм
источник