• tf idf и word2vec для создания векторов из всех предложений. После этого мы можем сделать что-то вроде anomaly detection, то есть искать и удалять векторы, которые сильно отклонены от большинства других векторов.
Поиск аномалий скажет тебе что необычно, но при этом туда может попасть чтото редкое но важное. Спам фильтры по сути тоже поиск аномалий. Можешь попробовать pyod моделей там много экспериментируй. Еще тебе надо сократить размерность причем значительно. Ну и главное нужно понять по смыслу что значит "обещание"