Возможно это прозвучит странно, но мне сразу в голову пришли архивы ФИДО эх. Там конечно будет не официальный стиль письма, но зато данные будут разделены на тематические группы. Я погуглил и нашёл такое https://wfido.ru/all/c
Авторы в ФИДО всегда уникально идентифицировались по адресу виду X:YYYY/ZZ.XX
Большое спасибо! Мне это пригодится. В этом году на соревновании https://pan.webis.de/ идентификация авторства связана с тематическим моделированием
Уже завтра ITGM №14. И если вы собирались, но забыли, или не знали, и вам нечего делать в субботу, самое время освежить память и перейти по ссылке: https://piter-united.ru/