Так статьи всё-таки нужно самостоятельно в датасет конвертировать? Там столько статей, одному явно это не по силам. Скорее всего ожидается анализ по каким-то другим параметрам. Находил готовый датасет, с категориями, но статьи только на английском :(