Анализировать нужно будет именно русскоязычные тексты.
А почему Спайси? Ну, потому что я бегло посмотрел возможности и "порог входа" на примере SpaCy, Natasha и Google-сервиса и подумал, что мне легче будет со SpaCy.
Опыта у меня нет никакого в этом деле (если не считать нескольких опытов в работе с томита-парсером от яндекса) и нахожусь я в самом начале пути. Поэтому, если знающие люди скажут, что Наташа лучше, а, главное, проще в освоении, то могу и на Наташу переключиться.
Т.е. инструмент не принципиален. А задача примерно такая (всё для русского языка): 1) Распознать именованные сущности (топонимы, геообъекты); 2) Найти "географическую связь" между ними, если есть.
Например "Новое шоссе соединит Солнцево и Бутово." -> 1) Распознаем в тексте "Солнцево", "Бутово"; 2) Обнаруживаем "географическую связь" между ними "шоссе соединит".
Насколько я понимаю, задача 1) должна относительно легко решаться существующими библиотеками "из коробки", без дообучения. А вот задача 2) это как раз то, что они не умеют делать. Я думаю, что задачу 2) можно решить с помощью rule-based подхода.