Телеграмм чат группы hadoopusers страница 1735

всем привет, вопрос по мониторингу AWS S3 - может кто сталкивался с такой штукой.
Вкратце - есть s3 path, в которую пишется стрим, хочется добавить простое правило в CloudWatch - если данные не заливаются последние X минут, триггернуть алерт. как это проще всего сделать

источник

11:41пожаловаться #5

AZ

Anton Zadorozhniy in Data Engineers

Renarde

всем привет, вопрос по мониторингу AWS S3 - может кто сталкивался с такой штукой.
Вкратце - есть s3 path, в которую пишется стрим, хочется добавить простое правило в CloudWatch - если данные не заливаются последние X минут, триггернуть алерт. как это проще всего сделать

там вроде дименшен только по бакету, но можно сделать фильтр по префиксу, и использовать метрику для бакета и конкретного фильтра

источник

11:49пожаловаться #6

R

Renarde in Data Engineers

а вот вопрос чем заполнять CloudWatch (как метрики то отсылать)
Я вижу такие опции:
- навесить на бакет SNS нотификации -> отправлять их в SQS -> лямбдой отдавать в CloudWatch
- CloudTrail -> логи -> CloudWatch
- И еще есть какие-то put-метрики, описанные в разделе мониторинга в самом S3

источник

11:54пожаловаться #7

AZ

Anton Zadorozhniy in Data Engineers

вот эти метрики на бакете настроить можно https://docs.aws.amazon.com/AmazonS3/latest/dev/cloudwatch-monitoring.html#s3-request-cloudwatch-metrics

Amazon

Monitoring Metrics with Amazon CloudWatch - Amazon Simple Storage Service

Amazon CloudWatch metrics for Amazon S3 can help you understand and improve the performance of applications that use Amazon S3. There are two ways that you can use CloudWatch with Amazon S3.

источник

11:59пожаловаться #8

AZ

Anton Zadorozhniy in Data Engineers

там конечно best effort в плане доставки, но у меня не было проблем

источник

11:59пожаловаться #9

S

Serg Slipushenko in Data Engineers

Есть тут такие, ктот крутит спарк на k8s? Может кто нибудь сталкивался с задачей сбора логов со спарк экзеков в таком случае? Дока говорит, логи на подах есть, а дальше придумайте сами)
Логов много и пушнуть их в ELK не вариант

источник

12:18пожаловаться #10

AZ

Anton Zadorozhniy in Data Engineers

Serg Slipushenko

Есть тут такие, ктот крутит спарк на k8s? Может кто нибудь сталкивался с задачей сбора логов со спарк экзеков в таком случае? Дока говорит, логи на подах есть, а дальше придумайте сами)
Логов много и пушнуть их в ELK не вариант

Fluentd/Fluentbit и если надо по ним искать то нужен все-таки какой-то индекс, просто там можно не хранить на большую глубину

источник

12:22пожаловаться #11

S

Serg Slipushenko in Data Engineers

Не втащит efk... Юзаем его для всего остального

источник

12:23пожаловаться #12

S

Serg Slipushenko in Data Engineers

Но логов со спарка ооооочень много может прилетать

источник