а можешь поподробней про "копание в данных" раскрыть? чем пользоавться предполагается? куда результаты пойдут? какое соотношение "копания" к сервисам? сервисы - суть etl?
ну вот например есть лог событий "пользователь нажал кнопку показать телефон на сервисе" (ну и других аналогичных), а есть лог событий телефонных звонков (кто куда позвонил). задача — получить связки сессий/uid пользователей и телефонов, принадлежащих им. это скорее etl-like задача — надо результат в сторадж сложить.
есть другая задача — есть набор объектов со свойствами (например, машинки), и нужно быстро находить похожие машинки по запросу или по другому набору (в котором есть не все свойства) — это и etl-like, и rt-like сервисы.
есть третья задача — есть массив данных: логи звонков, логи из задачи номер один, данные разных классификаторов про номера телефонов, есть задача в момент прихода звонка за бюджет в 0.3-0.6 секунды принять решение о том, к какому классу относится звонок (напрмиер — обычный человек звонит про машинку, перекуп, прикидывающийся обычным человеком, дилер, который хочет тачку выкупить или просто нерелевантный звонок предложения массажа на дому). это rt.