Для русского языка ещё важно обратить внимание на порядок слов, который может быть практическии произвольным и следовательно является большим источником ентропии для идентификации.
У меня были некоторые наработки на обратную тему т.е. на иденитфикацию личности по тексту, но это было довольно давно и я не думаю, что у меня что-то сохранилось.
У меня были некоторые наработки на обратную тему т.е. на иденитфикацию личности по тексту, но это было довольно давно и я не думаю, что у меня что-то сохранилось.
ну вот, я как раз таки хочу затруджнить подобного рода анализ
Далее, привести грамматические единицы к некоторому стандартному порядку. Скажем там, причастные обороты переставить сразу после слова, к которому они относятся.