Куду хз, как-то тут уже обсуждалось что непонятно что с проектом
В hbase блобы конечно можно, но зачем doc/xls туда пихать я не знаю, я бы только мета инфу где на s3 каком лежит
Несколько гигов в день, это вы на 1 тб памяти год можете прожить просто в память складывая
Там есть отчеты до документам за день, которые должны выполняться за секунды)
Ну и опять же, на вырост.
И high availability, т.е. масштабируемость.