это вы между собой решайте, а конечному пользователю как эту либу использовать? Конкретная проблема у человека есть, что ему нужно набрать, чтоб ее решить и (желательно) не создать пачку новых проблем?
это вы между собой решайте, а конечному пользователю как эту либу использовать? Конкретная проблема у человека есть, что ему нужно набрать, чтоб ее решить и (желательно) не создать пачку новых проблем?
просто брать и использовать. если что, автор доступен и может дать пример
если у меня стоит задача эффективно скопировать десяток датасетов из s3 в хдфс на кластер (в разных исходных форматах), я её решаю. путь, куда складывать в hdfs, конфигурируется. количество файлов в хдфс тоже конфигурируется. как их назвать — вообще дело десятое.
а "стандартного" нормального инструмента в емр, окромя s3-dist-cp, между прочим, нет. но паркеты он читать не умеет. везде советуют колхозить с union. и очень странно, что некоторые считают, что нельзя сделать по-человечески
если у меня стоит задача эффективно скопировать десяток датасетов из s3 в хдфс на кластер (в разных исходных форматах), я её решаю. путь, куда складывать в hdfs, конфигурируется. количество файлов в хдфс тоже конфигурируется. как их назвать — вообще дело десятое.