я был бы очень рад обойтись каким-нить sql-ем, чтобы сджойнить мои миллионы записей с миллиардами, но на таких объёмах кластерный оракл будет дорогой как чёрт знает что. на спарке отлично получается делать всё то же самое, но только солнышко приходится закатывать вручную временами