господа, а как корректнее всего будет 404 хендлить, чтобы репорт делать в итоге по страницам?
handle_httpstatus_list = [404]
– вот такой параметр есть для спайдера, но в доке пишут, что это не тру вей.
я бы мог, конечно, просто для отчета из исходного масссива урлов удалить конечные, но ведь там могут быть еще и 503, которые обычно из-за бана моего спайдера происходить будут.