V
Берешь уже готовую модельку с tl, обучаешь, все ок.
Дальше делишь свои монетки на 64 части(условно), 8 по ширине и 8 по высоте. Сравниваешь их попарно по элементам. Все это отлично залезет в 1 батч даже на cpu. Дальше смотришь по трэшхолду где у тебя различия, и если хочешь - берешь отдельный квадрат, и делаешь с ним то же самое.
После этого, условно говоря, за 2 батча можно найти различия в монетках на площади в 64х64 квадрата, что на изображении 256х256 эквивалентно 4 пикселям.
Это ж чисто инженерная задача, чо тут думать то.