будет через пару недель отдельная утилита, чтобы писать в/из емровского хдфса через все нативные filesystem и типа "плагины" как раз на пару сотен строк. jdbc, чужие s3, и всё пока. был ещё аэроспайк, но ушёл в историю.
изначальная цель была заменить dist-cp, а щас эта штука уже стала поинтереснее. по крайней мере, сильно быстрее, и умеет сливать паркеты