Size: a a a

2020 September 27

PO

PROLOG ONE LOVE in pro.algorithms
В случае одинакового шрифта там n^2
источник

PO

PROLOG ONE LOVE in pro.algorithms
Но я бы такому не доверял
источник

@N

@urandon Nikita Khom... in pro.algorithms
Boris Vinogradov
ну смотри геометрия это изгибы в 3 измерениях и выпуклости и прочий шум типа теснения бумаги
На самом деле б-сплайнов реально хватает даже в коммерческих OCR
источник

BV

Boris Vinogradov in pro.algorithms
@urandon Nikita Khomutov
На самом деле б-сплайнов реально хватает даже в коммерческих OCR
да, но это уже не линал и автору будет очень тяжело это курить
источник

ПК

Паша Калугин... in pro.algorithms
PROLOG ONE LOVE
Не, ну можно втупую за n^3 чекнуть двумерными хэшами, как вариант еще...
я перепроверил — можно и медленными способами
источник

ПК

Паша Калугин... in pro.algorithms
главное вытянуть 3-4 проверки в секунду
источник

ПК

Паша Калугин... in pro.algorithms
не обязательно распознавать, какая эта буква, достаточно определять, есть ли она
источник

@N

@urandon Nikita Khom... in pro.algorithms
MaxGraey
Если не нейронные сети, то какой-нибудь OCR на основе cкрытой марковской модели (Hidden Markov). Если и это сложно, то тогда даже не знаю, ни один аналитический алгоритм не будет обладать хоть сколь нибудь достоверной точностью
Ну, вообще можно, конечно, скелет построить, а потом учиться на скелете: его топологии и параметрах кривых между "суставами". Путь более сложный, с каждым шрифтом новые приключения. Но зато где-то можно время в рантайме сэкономить
источник

M

MaxGraey in pro.algorithms
Паша Калугин
одинаковый шрифт, отсутствие сдвигов/поворотов
Ну можно тогда попробовать посчитать корреляцию попарно между текущим изображением и всеми остальными в алфавите, можно еще какие то метрики добавить для надежности
источник

LO

Lucky Ook in pro.algorithms
@urandon Nikita Khomutov
Ну, вообще можно, конечно, скелет построить, а потом учиться на скелете: его топологии и параметрах кривых между "суставами". Путь более сложный, с каждым шрифтом новые приключения. Но зато где-то можно время в рантайме сэкономить
Думается, имеет смысл убрать лишнюю информацию чем-то вроде dejavu.
источник

@N

@urandon Nikita Khom... in pro.algorithms
Lucky Ook
Думается, имеет смысл убрать лишнюю информацию чем-то вроде dejavu.
Не понял, какую информацию?  И чем dejavu поможет?
источник

LO

Lucky Ook in pro.algorithms
@urandon Nikita Khomutov
Не понял, какую информацию?  И чем dejavu поможет?
оставит только чёрное в картинке.
источник

@N

@urandon Nikita Khom... in pro.algorithms
Lucky Ook
оставит только чёрное в картинке.
А, ну бинаризацию тут уже не надо делать, тут картинка изначально бинаризована
источник

PO

PROLOG ONE LOVE in pro.algorithms
Тогда тебе к бинаризаторам типа отцу
источник

@N

@urandon Nikita Khom... in pro.algorithms
Ну и да, может ещё имеет смысл с фильтрами мат.морфологии поиграться чтоб артефакты бинаризации подправить
источник

M

MaxGraey in pro.algorithms
MaxGraey
Ну можно тогда попробовать посчитать корреляцию попарно между текущим изображением и всеми остальными в алфавите, можно еще какие то метрики добавить для надежности
источник

PO

PROLOG ONE LOVE in pro.algorithms
Можно херакнуть статистики и засунуть это все в кластеризатор тогда)
источник

@N

@urandon Nikita Khom... in pro.algorithms
Считать optical flow между эталонами?.. Может и есть в этом какой-то смысл, это надо экспериментировать
источник

M

MaxGraey in pro.algorithms
@urandon Nikita Khomutov
Считать optical flow между эталонами?.. Может и есть в этом какой-то смысл, это надо экспериментировать
Это не optical flow, это все таже статистика, только более локализированная с выделением контурных точек
источник

CD

Constantine Drozdov in pro.algorithms
@urandon Nikita Khomutov
Ну, вообще можно, конечно, скелет построить, а потом учиться на скелете: его топологии и параметрах кривых между "суставами". Путь более сложный, с каждым шрифтом новые приключения. Но зато где-то можно время в рантайме сэкономить
У нас вроде такое радонили, но я не помню деталей
источник