Телеграмм чат группы hadoopusers страница 2775

Всем привет! Коллеги, подскажите в чем проблема. Испульзую спарк стриминг для чтения из кафки, однако он выводит только первое сообщение, а остальные нет

spark = SparkSession \
    .builder \
    .appName('Test') \
    .getOrCreate()

lines = spark \
    .readStream \
    .format("kafka") \
    .option("kafka.bootstrap.servers", "10.1.25.111:9092, 10.1.25.112:9092, 10.1.25.113:9092") \
    .option("subscribe", "dev.etl.fts-ftp.agr2") \
    .option('startingOffsets', 'earliest') \
    .load()


lines \
  .selectExpr("CAST(key AS STRING)", "CAST(value AS STRING)") \
  .writeStream \
  .format("console") \
  .start() \
  .awaitTermination()

источник

18:49пожаловаться #6

Vitaly Petrov in Data Engineers

Михаил Связный

spark = SparkSession \
    .builder \
    .appName('Test') \
    .getOrCreate()

lines = spark \
    .readStream \
    .format("kafka") \
    .option("kafka.bootstrap.servers", "10.1.25.111:9092, 10.1.25.112:9092, 10.1.25.113:9092") \
    .option("subscribe", "dev.etl.fts-ftp.agr2") \
    .option('startingOffsets', 'earliest') \
    .load()


lines \
  .selectExpr("CAST(key AS STRING)", "CAST(value AS STRING)") \
  .writeStream \
  .format("console") \
  .start() \
  .awaitTermination()

Передай Паше Кащенко привет))
Узнал по IP)

источник

18:54пожаловаться #7

МС

Михаил Связный... in Data Engineers

Pavel Kashchenko in Data Engineers

передал, спасибо )

источник

18:55пожаловаться #9

Pavel Kashchenko in Data Engineers

Тебе тож привет )

источник

18:55пожаловаться #10

Vitaly Petrov in Data Engineers

Попробуй offset убрать

источник

18:58пожаловаться #11

МС

Михаил Связный... in Data Engineers

Vitaly Petrov

Попробуй offset убрать

результат тот же

источник

18:59пожаловаться #12

KrivdaTheTriewe in Data Engineers

Dmitry Zuev

4_5838213749135114609.mp4

(81.42 Кб)

Пошли после митапа

источник

19:32пожаловаться #13

Dmitry Zuev in Data Engineers

Пошли

источник

19:32пожаловаться #14

Dmitry Zuev in Data Engineers

Можно вместо

источник

19:32пожаловаться #15

Алексей in Data Engineers

в чем проблема писать мл на oracle, он все умеет) http://blog.skahin.ru/2020/03/oracle-dataminer-ml-python-sklearn.html

источник

19:55пожаловаться #16

Oleksandr Averchenko in Data Engineers

Алексей

в чем проблема писать мл на oracle, он все умеет) http://blog.skahin.ru/2020/03/oracle-dataminer-ml-python-sklearn.html

mssql тоже умеет

источник

22:41пожаловаться #17

2020 September 19

Max Efremov in Data Engineers

Ох, реклама прям в нике)

источник

15:31пожаловаться #18

Roman Kalmanson in Data Engineers

Max Efremov

Ох, реклама прям в нике)

Не спорю. Но и не во вред здешнему народу :)

источник

17:00пожаловаться #19

2020 September 20

Serg D. in Data Engineers

Всем привет. Ребят, подскажите, пожалуйста. Работаю интерактивно со spark-shell. Команды типа explain или sc.getConf.getAll выводят ограниченное кол-во строк. Нагуглил spark.debug.maxToStringFields, но установка этого параметра ничего не меняет. Как увидеть полный вывод?

источник

13:59пожаловаться #20