Я поставил себе задачу: из свалки видео найти похожие.
Похожие - значит это один и тот же фильм, но может с другим кодеком, другим разрешением, может один из них слегка обрезан.
Можно свести задачу к похожести картинок: вырезать например кадры из первого видео, сравнить с кадрами второго, и получить некое расстояние между фильмами. Но нужно расстояние между картинками.
У меня есть две идеи.
1) диплёнинг натренировать
2) более традиционно - взять две картинки, привести к одному разрешению, ещё как-то нормализовать (может по яркости), потом от обеих взять фурье и там старшие коэффициенты, дальше евклидова норма
Пробую п.2, кажется, получается плохо.
Какие ещё известны способы?
Посмотри как YouTube определяет лицензионный контент и банит его. Возможно где есть такое.