Подскажите как правильно организовать сохранение большого количества хтмл страничек (> 100 000 ) которые разбросаны по всему сайту - т.е. нужно лазить по сайту и сохранять соответствующие фильтру страницы. Всего страниц 1кк+. Решил в лоб - в пауке сохраняю - но долго получается из-за блокировки при сохранении. Надумал в одном потоке парсить и найденное бросать на обработку в другой поток, но тогда все равно там задержка. Как можно, не знаю как правильно сказать, асинхронно или многопоточно в данном случае можно сохранить результат?