Size: a a a

2020 September 17

AB

Andrey Bel in Data Engineers
как и в отусе!!
источник

AB

Andrey Bel in Data Engineers
отус сам проходил, оч сжато и по делу
источник

SS

Sergey Sheremeta in Data Engineers
коллеги, помогите ...
как добиться фильтрации столбцов ДатаФрейма только заданными в схеме/case-class?

case class People (name: String, sex: Option[String])

import org.apache.spark.sql.{Encoder, Encoders}
implicit val peopleEncoder: Encoder[People] = Encoders.product[People]

val someDF = Seq(
     ("Mike", "M", Integer.valueOf(30)),
     ("John", "M", Integer.valueOf(50))
   ).toDF("name", "sex", "age")
   
someDF.show()

val peopleDF = someDF.as[People].toDF()
peopleDF.show()
источник

DZ

Dmitry Zuev in Data Engineers
мы через селект по схеме делали
источник

SS

Sergey Sheremeta in Data Engineers
источник

DZ

Dmitry Zuev in Data Engineers
я про это и говорю
источник

SS

Sergey Sheremeta in Data Engineers
я видимо неверно понимал работу преобразований датафрейм-датасет (((
источник

DZ

Dmitry Zuev in Data Engineers
а зочем делать toDF()
источник

SS

Sergey Sheremeta in Data Engineers
потому что сигнатура метода требует аутпут в виде  датафрейма
источник

DZ

Dmitry Zuev in Data Engineers
df
     .select(encoder.schema.fields.map(f => col(f.name)).toList: _*)
     .as[U]
источник

DZ

Dmitry Zuev in Data Engineers
если так то без .as[U]
источник

SS

Sergey Sheremeta in Data Engineers
Dmitry Zuev
df
     .select(encoder.schema.fields.map(f => col(f.name)).toList: _*)
     .as[U]
спасибо!
источник

SS

Sergey Sheremeta in Data Engineers
а все-таки - почему
df.as[U].toDF()
не отсекает отсутствующие в U столбцы?
источник

DZ

Dmitry Zuev in Data Engineers
@pomadchin  ты знаешь?
источник

GP

Grigory Pomadchin in Data Engineers
неа, но есть вопрос - а как и надо ли?
источник

SS

Sergey Sheremeta in Data Engineers
scala 2.11.10, spark 2.4.5
источник

GP

Grigory Pomadchin in Data Engineers
к тому что, почему отсекание отсвтуюших в у столбцов должно быть?
источник

GP

Grigory Pomadchin in Data Engineers
Ошибку так легко допустить
источник

SS

Sergey Sheremeta in Data Engineers
источник

DZ

Dmitry Zuev in Data Engineers
Grigory Pomadchin
Ошибку так легко допустить
не понимать
источник