IT-шники, кто в теме?
Допустим я скачала список всех зарегистрированных действующих лекарств без наркотических веществ в РФ например это 7тыс шт, хочу как-то добавить целые инструкции к каждой (инструкции находятся по первым ссылкам в гугл или может есть уже готовые медицинские сайты с описанием самих лекарств) - парсить или как?
Дальше хочу создать небольшой фильтр поиск по тексту, например, найти такие слова и фразы как "отёк" и "другие аллергические реакции". И исключить все с этими словами и фразами. Это вообще какие инструменты, куда смотреть? Python с какой-нибудь библиотекой такое умеет? Если да, то с какой?
Допустим дальше я хочу фильтровать по классификатору болезней (такое уже делают на мед. сайтах). Скопировать код и изменить немного как нужно?
Дальше хочу найти все возможные слова из рецептов как ещё описывают аллергии и добавить их в фильтр. Это тоже парсить?
И как-то все это собрать, чтобы фильтр запускать, когда понадобится
Посоветуете, куда смотреть?)