Определенное сходство, наверное, есть. Я, правда, не очень понял, что именно сравнивается с Data lake. Если Sphinx-doc + git, то общим является то, что и там и там в основе лежит поток событий (git реализует принципы event sourcing).
К этому потоку может подключиться слушатель, и заредьюсить этот поток в свое собственное представление знаний.