причем это только начало ) после этого из этих 12 млн надо будет найти самые длинные цепочки, у нас там уже примерно из 10+ зависимостей, сходить в апи, дёрнуть название этих айди с дискрипшеном, а потом на этой хуйне сделать классификатор на тенсорфлоу