Короч, парсил я наши файлики результатов, чтобы найти все измерения по Беларуси во время шатдауна, и на результаты за один час у меня ушли сутки, при том, что файлик я уже предварительно себе вытягиваю. Ok, полез смотреть. Никакой магии: каждая строка - это json, и строк очень-очень много (ну, там за час терабайты этих файликов с jsonами набегает).
Я-то знаю, что я ищу, так что выкрутился, генерируя сильно оптимизированный regex, которым сначала проверяю - есть в строке нужный префикс или нет, и только если есть, делаю парсинг этого json, проверяю уже точно его поля, и если все ок, сохраняю результаты. Ускорение на порядки.
Но вот у РКН, который хочет парсить XMLи про всё на свете, такой опции нет, ему надо таки распарсить всё. Одно из двух: или тяжко придётся РКНу и его подрядчикам, придется много денег осваивать для работы с этим XML; или в гробу они видели что-то на самом деле с этим XML делать.