Это я ищу варианты для того, чтобы построить feature store, ну или, наоборот, альтернативы ему. Есть такая проблема, наверное, классическая - есть большой хадупокластер без всяких дельта лейков и худи, просто хайв, и дохрена и больше исторических данных, которые укладываются в даталейк по классике (raw - dds - cdm...). И есть колумнарная витрина с фичами для сатанистов на over 9000 фичей, которую, наверное, в каждом кейсе при обучении используют. Ну и ситуаций обычно три - или сатанистам надо взять все фичи разом для конкретного пользователя за некий период вглубь (обычно дохера данных за несколько лет), или же взять все фичи разом на последнюю доступную дату, либо же уже берут отдельные фичи с произвольной глубиной. С последним кейсом худо-бедно текущая реализация работать позволяет. С первыми же двумя это все превращается в адище ебаное - во-первых, и сама витрина отстаёт, т.к. море источников, ну и при попытке поднять данные и поджойнить, даже если ограничения на партиции выставить, все равно поднимается чертова прорва данных, и это все мееееедленно крутится. Ну и добавление фич в витрину в такой ситуации тоже так себе процесс. Уверен, что можно лучше все это реализовать, и сижу думаю над разными подходами и технологиями, которые можно заюзать.