Open-Source библиотека для нормализации строковых значенийСталкивались с тем, что нужно привести строку кода к нижнему регистру или заменить «ё» на «е», а время терять не хочется? Валентин Хомутенко, Go-разработчик в Авито, решил упростить жизнь себе и другим. Взял и сделал open-source библиотеку Normalizer.
В библиотеке — набор инструментов, которые нормализуют строковые значения. Их можно сравнивать или использовать в качестве уникальных идентификаторов. Доступные функции позволяют:
• привести всю строку к нижнему регистру,
• удалить специальные символы,
• заменить кириллические символы и умлауты (ä, ö, ü)
на латинские эквиваленты,
• заменить й → и,
• сравнить нормализованные строки, используя расстояние Левенштейна.
Узнать, как пользоваться инструментарием библиотеки, можно на Гитхабе →
http://bit.ly/3dvyBDe