ребята, посоветуйте, пожалуйста, как решить проблему. Для задачи чистки/унификации текстовых данных в столбце pandas пытаюсь использовать replace по словарю с регуляркой. С regex False замена не происходит, с regex True выдает ошибки, в связи с наличием спецзнаков в словаре.
Желательно их там и оставить; после предв. чистки пунктуации и спецзнаков эти знаки ни убрать совсем, ни заменить везде одинаково не получится без нарушения смысла. Там остаются ".", "/", "$", "%", "+" (первые 4 - из-за дробных значений в спецификациях, описаний дискаунтов и цен, а плюс в одних случаях меняется на пробел, но в других - должен стать plus, из-за названий множества разных моделей оборудования).
Как правильно и массово экранировать знаки в словаре? Нужно использовать re.escape?
Мои попытки это сделать не удались.
Не хотелось бы уменьшать и вычищать словарь, но уже близка к этому, лишь бы хоть alphanumeric куски сработали, которые без всяких знаков 🙈
Пробовала еще библиотеку flashtext (keywordprocessor и replace_keywords в цикле), она ругается так: "unsupported operand type(s) for +: 'float' and 'str'