Size: a a a

2020 September 17

DZ

Dmitry Zuev in Data Engineers
Sergey Sheremeta
а почему они невидимы? почему они не отбрасываются при преобразовании DF - DS - DF ?
Затащи кароч мой код, и забей
источник

SS

Sergey Sheremeta in Data Engineers
а разве df.select() это не та же проекция?
источник

A

Alex in Data Engineers
Dmitry Zuev
Селект тоже проекция
В селекте проекция какие поля дальше пускать

As проекция на уровне компилятора для удобства типов, оптимизатор ничего под это не делает
источник

SS

Sergey Sheremeta in Data Engineers
Dmitry Zuev
Затащи кароч мой код, и забей
затащил, работает! грасиас, сеньор )
источник

A

Alex in Data Engineers
По этому и говорю чтобы с as были аккуратней
источник

SS

Sergey Sheremeta in Data Engineers
похоже, что без погружения в кишки JVM дата-помидоркой не стать?
источник

A

Alex in Data Engineers
Нет, это нюансы спарка, не jvm
источник

SS

Sergey Sheremeta in Data Engineers
Alex
По этому и говорю чтобы с as были аккуратней
спасибо, учтем и запомним!
источник

A

Alex in Data Engineers
Может в третьем что-то и поменяли, не смотрел, но на втором там явно это было написано
источник

A

Alex in Data Engineers
Sergey Sheremeta
спасибо, учтем и запомним!
Простейший пример:
Паркет файл
Прочитали
1. Сделали селект и дальше по пайплайну пойдут только поля которые выбрали, другие читаться не будут даже
2. Сделали as и считаете что только те поля. Но на самом деле таскаете весь паркет файл, никакой фильтрации ненужных колонок не произойдёт
источник

DZ

Dmitry Zuev in Data Engineers
Alex
В селекте проекция какие поля дальше пускать

As проекция на уровне компилятора для удобства типов, оптимизатор ничего под это не делает
Ну не знаю. У датасета и фрейма разные оптимизации по памяти
источник

AE

Alexey Evdokimov in Data Engineers
то бишь as это просто приведение типа, а underlying object не меняется
источник

DZ

Dmitry Zuev in Data Engineers
Alex
Может в третьем что-то и поменяли, не смотрел, но на втором там явно это было написано
Где написано то?
источник

A

Alex in Data Engineers
источник

A

Alex in Data Engineers
* Note that as[] only changes the view of the data that is passed into typed operations,
  * such as map(), and does not eagerly project away any columns that are not present in
  * the specified class.
источник

DZ

Dmitry Zuev in Data Engineers
Окай
источник

DN

Dmitriy Novikov in Data Engineers
Andrey Bel
некоторым работодатель оплачивает, некоторым нужен волшебный пинок и тд,  а кому то норм и по книгам заниматься, за ньюпролаб знаю что там оч толковые преподы
в отусе уже 2 курс прохожу, крайне недоволен на самом деле
источник

DN

Dmitriy Novikov in Data Engineers
Andrey Bel
некоторым работодатель оплачивает, некоторым нужен волшебный пинок и тд,  а кому то норм и по книгам заниматься, за ньюпролаб знаю что там оч толковые преподы
ну мне сертифкат нужен
источник

AB

Andrey Bel in Data Engineers
Dmitriy Novikov
в отусе уже 2 курс прохожу, крайне недоволен на самом деле
а что не нравиться?
источник

DN

Dmitriy Novikov in Data Engineers
Andrey Bel
а что не нравиться?
слабые и скучные домашки
источник