Size: a a a

2021 April 26

AE

Alexey Evdokimov in Data Engineers
половина ещё и пожато. вот интересно, в рамках кровавого энтерпрайза это сколько бы нулей в год стоило в каком-нить более-менее горячем сторидже на своём железе держать
источник

N

Nikita Blagodarnyy in Data Engineers
Потому что оракл-это зрелая многофункциональная, прекрасно документированная и изученная, полноценная СУБД (хоть и не лучшая в мире) с килотоннами всякого полезного функционала, полный список которого никто даже не знает целиком. Если в документации написано, что есть инструкция MERGE, то она будет нормально работать в 99% случаев. В оставшемся 1 проценте вам предоставят 10 испробованных воркэраундов с металинка. А худи - это файлики с метаданными, к которым надо прикручивать какой-то компьют и как это всё будет работать-никто не знает. Может отработать 3 месяца и в какой-то момент начать по 52 часа в 1 воркер собирать какие-то говнофайлы, 3 индуса из слака, которые что-то понимают, советуют включить экспериментальную фичу в новой версии, которая хоронит данные напрочь. Я не говорю про проблемы среды компьюта, которая то может достучаться до своих экзекуторов, то нет.
Поэтому мне видится, что если задачу можно решить внутри РСУБД-то её лучше решать в РСУБД.
Между нами говоря, за оракловый саппорт можно и не плотить, я знаю пяток компаний, которые так делают и молятся никогда не словить неведомый доселе ORA-600, для которого описание только у вендора есть.
источник

ИК

Иван Калининский... in Data Engineers
Понятно, спасибо! Я это тогда написал про использование OSS delta lake. Конечно, делать merge в объектном хранилище несравнимо сложнее, чем пользоваться инструментом, который для этого предназначен, отлажен и вообще немного про другое. Делать merge в объектном хранилище транзакционным (с изоляцией и атомарностью) - вообще кринж выходит((
источник

N

Nikita Blagodarnyy in Data Engineers
добить только ram и дисков.
источник

AZ

Anton Zadorozhniy in Data Engineers
Я в первой половине нулевых делал такие числодробилки как у вас для корпораций, по тем технологиям и нынешним ценам - где-то 1500 usd/month, 1000 если прям прижиматься
источник

N

Nikita Blagodarnyy in Data Engineers
Увы пока все эти попытки сделать mutable из immutable выглядят довольно сырыми. Ну вдруг когда станут суперстабильными.
источник

А

Алексей in Data Engineers
а лучшая, это конечно террадата?)
источник

ИК

Иван Калининский... in Data Engineers
сами не станут, кто-то их должен такими сделать
источник

N

Nikita Blagodarnyy in Data Engineers
а облаком дороже выходит
источник

AE

Alexey Evdokimov in Data Engineers
в облаке половину можно упихнуть в glacier
источник

N

Nikita Blagodarnyy in Data Engineers
источник

AE

Alexey Evdokimov in Data Engineers
а с учётом +N тб каждый месяц, на своём железе докупать диски задолбаешься
источник

AZ

Anton Zadorozhniy in Data Engineers
Есть волшебный мир Dedicated ;)
источник

AE

Alexey Evdokimov in Data Engineers
в облаке про апкип кост можно вообще забыть
источник

AZ

Anton Zadorozhniy in Data Engineers
Осталось научится писать название без ошибок - и добро пожаловать в наш маркетинг!
источник

А

Алексей in Data Engineers
две р, чтобы грозно звучало и внушало
источник

AZ

Anton Zadorozhniy in Data Engineers
Glacier это бэкап на лентах, на случай когда все остальные бэкапы потеряли, читать оттуда не дёшево (и медленно)
источник

AE

Alexey Evdokimov in Data Engineers
зато хранить архив там дешево. а поднимать сотни хлама, про который все давно забыли (и о чём говорил топикстартер), нужно бывает крайне редко
источник

AE

Alexey Evdokimov in Data Engineers
и ещё более полезен, если есть требование хранить сорсы N лет, например
источник

AE

Alexey Evdokimov in Data Engineers
и держать под такое железо вообще совсем уж глупо
источник