я тут пытался найти закономерность в названиях документов и обнаружил, что первые несколько цифр (3-5) указывают на источник документа, то есть два документа с одинаковыми цифрами вначале будут с одного сайта. Можно ли считать, что определенный источник всегда пишет новости/ статьи на одном и том же языке? И можно ли опираться на название документа? - вот в чем вопрос
"Для проверки работ будет использоваться набор данных, отличный от тестовых. "