Size: a a a

2021 April 20

ME

Mikhail Epikhin in Data Engineers
А в чем проблема? указываете endpoint и поехали
источник

AE

Alexey Evdokimov in Data Engineers
это как штатным образом делается?
источник

ME

Mikhail Epikhin in Data Engineers
источник

ME

Mikhail Epikhin in Data Engineers
Да, конечно, только будьте готовы что реализации могут несколько отличаться
источник

AE

Alexey Evdokimov in Data Engineers
но в EMR не используется s3a, там какой-то свой коннектор
источник

ME

Mikhail Epikhin in Data Engineers
consistency listing могут сломаться
источник

ME

Mikhail Epikhin in Data Engineers
Да, там emrfs, но s3a можно и нужно пользовааться для других провайдеров
источник

AE

Alexey Evdokimov in Data Engineers
консистенси в амазоновском с3 щас строгий кстати, никакого больше емрфс
источник

ME

Mikhail Epikhin in Data Engineers
Ага, они молодцы
источник

AE

Alexey Evdokimov in Data Engineers
эт чё, предлагаете его в фатжар как-то добавлять?
источник

ME

Mikhail Epikhin in Data Engineers
тут заваисит от того как спарк запускаете
источник

AE

Alexey Evdokimov in Data Engineers
в комплекте емр он просто алиас для ихнего проприетарного коннектора, я опасаюсь что сломается всё нафиг
источник

ME

Mikhail Epikhin in Data Engineers
в EMR все запускается поверх hadoop и там уже есть hadoop-aws
источник

ME

Mikhail Epikhin in Data Engineers
вместе с клиентом s3a
источник

ME

Mikhail Epikhin in Data Engineers
Т.е. достааточно просто опции задать и все должно работать
источник

AE

Alexey Evdokimov in Data Engineers
не, там он несколько патченный
источник

ME

Mikhail Epikhin in Data Engineers
источник

ME

Mikhail Epikhin in Data Engineers
>The s3a protocol is not supported. We suggest you use s3 in place of s3a.
источник

AE

Alexey Evdokimov in Data Engineers
дык о чём и вопрос
источник

AE

Alexey Evdokimov in Data Engineers
чё делать-то?
источник