Size: a a a

2019 December 05

SA

Sergey Alekseev in Data Engineers
ну и зп соответствующие такому набору
источник

R

Roman in Data Engineers
Anton Zadorozhniy
это такой брачный танец который делают HRы и кандидаты, меня тоже подбешивает (я на принимающей стороне часто), просто принять как данность и подаваться туда где, как вам кажется, вы подходите по ключевым навыкам
Обычно Hrам скидывают описание вакансии лиды/руководители/какое-то другое название должности, которое отвечает за проект и команду, а также понимаю кого именно ему надо. Если в описании вакансии нужно все то, что описал коллега выше, то, скорее всего, ответственный человек, которому в команду нужен специалист, забил на составление описания вакансии и отдал это на откуп HR. А что может сделать hr? Тоько простыню накатать.
источник

AZ

Anton Zadorozhniy in Data Engineers
Roman
Обычно Hrам скидывают описание вакансии лиды/руководители/какое-то другое название должности, которое отвечает за проект и команду, а также понимаю кого именно ему надо. Если в описании вакансии нужно все то, что описал коллега выше, то, скорее всего, ответственный человек, которому в команду нужен специалист, забил на составление описания вакансии и отдал это на откуп HR. А что может сделать hr? Тоько простыню накатать.
все так и происходит обычно
источник

RI

Rustam Iksanov in Data Engineers
Коллеги. Кто какую использует нотификацию о работе спарк джоб? Хотелось бы получать сообщения об их ошибка и их падении.
источник

N

Nikita Blagodarnyy in Data Engineers
Rustam Iksanov
Коллеги. Кто какую использует нотификацию о работе спарк джоб? Хотелось бы получать сообщения об их ошибка и их падении.
В слак можно по web api слать.
источник

RI

Rustam Iksanov in Data Engineers
Nikita Blagodarnyy
В слак можно по web api слать.
или по smtp в коде,
это я понимаю
источник

N

Nikolay in Data Engineers
Логи в спланк и настроить нотиыикацию на [ERROR
источник

Ж

Жмака in Data Engineers
Как можно подсчитать сколько данных в день загрудается в HBase на  HDP?  Графики в графане изменить нельзя , чтобы суммировать метрики хотя бы для hlogFileSize
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Как можно подсчитать сколько данных в день загрудается в HBase на  HDP?  Графики в графане изменить нельзя , чтобы суммировать метрики хотя бы для hlogFileSize
по размеру директории в HDFS?
источник

Ж

Жмака in Data Engineers
Там вся информация по всем таблицам и очень много таблиц с разными TTL. Смотреть сколько сейчас и сколько было вчера будет неточно я думаю
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Там вся информация по всем таблицам и очень много таблиц с разными TTL. Смотреть сколько сейчас и сколько было вчера будет неточно я думаю
какая точность вам нужна?
источник

Ж

Жмака in Data Engineers
До десятков гига если возможно
источник

АЖ

Андрей Жуков in Data Engineers
Rustam Iksanov
Коллеги. Кто какую использует нотификацию о работе спарк джоб? Хотелось бы получать сообщения об их ошибка и их падении.
грейлог + почта и телеграм-плагин
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
До десятков гига если возможно
я не понял чем вам тогда не подходит анализ fsimage?
источник

Ж

Жмака in Data Engineers
Как и что я могу там получить?
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Как и что я могу там получить?
есть такая очень распространенная практика аналитики потребления HDFS: раз в день/неделю/месяц собирать fsimage, парсить его в CSV, затем складывать в какой-нибудь паркет, и анализировать
источник

AZ

Anton Zadorozhniy in Data Engineers
там хранится информация о всех файлах в HDFS, из размер, RF, число блоков и так дальше
источник

AZ

Anton Zadorozhniy in Data Engineers
используется обычно для анализа динамики, какие директории как быстро растут, а также это главный способ идентификации ребят которые пишут много мелких файлов
источник

AZ

Anton Zadorozhniy in Data Engineers
преобразование fsimage в CSV конечно делает  OIV http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsImageViewer.html
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Как и что я могу там получить?
соотвественно из fsimage вы можете узнать объем данных каждой таблицы, неймспейса, всего hbase инстанса
источник