databriks есть прямо в азуре, по Datamechanics такого не видо. а мне вероятно это важно из-за юристов. я так понимаю на азур перс данные сливать можно, куда-то еще не разрешат
у меня вопрос. если hdinside начнет писать на adls (допустим hot подписка) пару сотен тб в сутки, на сколько это дешевле/дороже может оказаться с hdinside с hdfs внутри ? я все за транзакции на adsl чтение/запись волнуюсь
Дешевле держать данные в объектном сторадже и поднимать разных размеров кластера дешевых машин для конкретных задач, ресайзить и убивать их на лету, чем держать флот дорогих машин с ИБ и держать данные на блочном сторадж и/или быстрых эфемерах