Size: a a a

2020 September 03

AS

Andrey Smirnov in Data Engineers
Sanzhar Magzumov
Ничего не значащая первая строка, которую просто надо выкинуть
может ее просто отфильтровать до момента показа?
источник

H

Hleb in Data Engineers
первая строка может быть любой если вы не сортируете дф
источник

H

Hleb in Data Engineers
поэтому смысл скипа первой строки и не ясен
источник

N

Nikita Blagodarnyy in Data Engineers
Хидеры небось из цсв засосал, не скипнул при чтении?
источник

SM

Sanzhar Magzumov in Data Engineers
Nikita Blagodarnyy
Хидеры небось из цсв засосал, не скипнул при чтении?
Да😀
источник

SM

Sanzhar Magzumov in Data Engineers
Лучше при чтении короче скинуть
источник

РП

Роман Пашкевич... in Data Engineers
Господа. А подскажите в какую сторону надо рыть?

Ни с того ни с сего. Перестали прилетать письма из питоновского джоба. Сам джоб и блок отправки письма отрабатывает без ошибок.

Либы:
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText

# Настройка отправки почты
FROM = "<e-mail>"
toaddr = ['<e-mail2>']
TO = 'To: ' + ', '.join(toaddr)

# Создаем контейнер для отправки отчета
msg = MIMEMultipart('Mixed')
msg['Subject'] = "Start Load."
msg['From'] = FROM
msg['To'] = ', '.join(toaddr[0:1])

Отправка:
s = smtplib.SMTP('localhost')
s.sendmail(FROM, toaddr, msg.as_string())
источник

N

Nikita Blagodarnyy in Data Engineers
Sanzhar Magzumov
Лучше при чтении короче скинуть
Тебя не смутило, что в данных говнецо? Они ж помимо показа ещё куда-то уехать должны будут.
источник

SM

Sanzhar Magzumov in Data Engineers
Ничего не съехало, но смутило😀 я прост ньюби со спарком, думал можно проще в рамках него первую строку срезать
источник

SM

Sanzhar Magzumov in Data Engineers
Но походу нет
источник

AS

Andrey Smirnov in Data Engineers
Sanzhar Magzumov
Лучше при чтении короче скинуть
просто укажи при чтении что файл с header
источник

SM

Sanzhar Magzumov in Data Engineers
Ага, спасибо
источник

A

Andrey in Data Engineers
Роман Пашкевич
Господа. А подскажите в какую сторону надо рыть?

Ни с того ни с сего. Перестали прилетать письма из питоновского джоба. Сам джоб и блок отправки письма отрабатывает без ошибок.

Либы:
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText

# Настройка отправки почты
FROM = "<e-mail>"
toaddr = ['<e-mail2>']
TO = 'To: ' + ', '.join(toaddr)

# Создаем контейнер для отправки отчета
msg = MIMEMultipart('Mixed')
msg['Subject'] = "Start Load."
msg['From'] = FROM
msg['To'] = ', '.join(toaddr[0:1])

Отправка:
s = smtplib.SMTP('localhost')
s.sendmail(FROM, toaddr, msg.as_string())
на smtp не улетают? что с портом? ребут?
источник

РП

Роман Пашкевич... in Data Engineers
Andrey
на smtp не улетают? что с портом? ребут?
Я как пользователь, не получаю письмо на ящик. А что происходит под капотом не знаю. У меня скорей вопрос, с подобной проблемой идти к админам ноды?
источник

А

Алексей in Data Engineers
логи smtp на ноде лучше посмотреть
источник

AS

Andrey Smirnov in Data Engineers
Роман Пашкевич
Я как пользователь, не получаю письмо на ящик. А что происходит под капотом не знаю. У меня скорей вопрос, с подобной проблемой идти к админам ноды?
как минимум добавить логирование эксепшенов в s/sendmail, если там все чисто, то тогда к админам
источник

РП

Роман Пашкевич... in Data Engineers
Алексей
логи smtp на ноде лучше посмотреть
Спасибо. Обратился к админам. Оказалось mail transfer agent  не может к .ru:25 подключиться
источник

I

Ilya in Data Engineers
Не подскажите, count по конкретному id в спарке возвращает скажем 40 значений, а тот же count в хайве/импале 100 значений. Куда копать?
источник

I

Ilya in Data Engineers
Причем Спарк видит все патриции (show partitions показывает правильное кол-во), но вот данные в них видит не все
источник

N

Nikita Blagodarnyy in Data Engineers
а spark.sql(«запрос из хайва, который выдает 100») сколько выдает?
источник