Size: a a a

2020 August 04

CF

Cool 🦊 Fox in Scrapy
Раз уже тут блог решения проблемы)
А как можно передать исключение timeout в process_request
источник

К

Кирилл in Scrapy
Cool 🦊 Fox
Привет, ребят подскажите пожалуйста
Использую scrapy-proxy-tool
Порой прокси отваливаются и натыкаюсь на timeout, и судя по тестам во время переподключения по timeout прокси не меняется.

DOWNLOADER_MIDDLEWARES = {
   'scrapy.downloadermiddlewares.retry.RetryMiddleware': 130,
   'scrapy_proxies.RandomProxy': 110,
   'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware': 120,
   'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,
   'scrapy_fake_useragent.middleware.RandomUserAgentMiddleware': 400,
   'scrapy_fake_useragent.middleware.RetryUserAgentMiddleware': 401,
}


Как исправить ?
Купи нормальные прокси
источник

AR

Andrey Rahmatullin in Scrapy
😹
источник

CF

Cool 🦊 Fox in Scrapy
Да нормальные они )
источник

CF

Cool 🦊 Fox in Scrapy
Но подвисают )))
источник

К

Кирилл in Scrapy
Cool 🦊 Fox
Да нормальные они )
С таймаутами ?)
источник

CF

Cool 🦊 Fox in Scrapy
Короче, задача стоит не посоветовать мне какие прокси купить, а обьяснить как словить timeout в  process_request 😉
источник

AR

Andrey Rahmatullin in Scrapy
что за бред?
источник

AR

Andrey Rahmatullin in Scrapy
process_request вызывается до отправки реквеста
источник

AR

Andrey Rahmatullin in Scrapy
и принимает только реквесты, какой ещё таймаут
источник

CF

Cool 🦊 Fox in Scrapy
Andrey Rahmatullin
process_request вызывается до отправки реквеста
спасибо тебе, вот теперь понятно, пойду ковырять дальше
источник

AR

Andrey Rahmatullin in Scrapy
это в доке написано чёрным по белому
источник

OS

Oleg Shleiko in Scrapy
а мне кажется у него нет обработки
источник

К

Кирилл in Scrapy
Cool 🦊 Fox
Короче, задача стоит не посоветовать мне какие прокси купить, а обьяснить как словить timeout в  process_request 😉
Я думаю у тебя типичная x y проблема, поэтому такой совет
источник

OS

Oleg Shleiko in Scrapy
источник

CF

Cool 🦊 Fox in Scrapy
Проблема в том что когда я получаю ошибку по таймауту, плагин который должен подставлять прокси её не видит ) Её в смысле ошибку)
источник

OS

Oleg Shleiko in Scrapy
есть callback, а есть errback, возможно ты это искал
источник

BL

Boris Litvyakov in Scrapy
Cool 🦊 Fox
Короче, задача стоит не посоветовать мне какие прокси купить, а обьяснить как словить timeout в  process_request 😉
написал в гугле "scrapy catch timeout exception" там есть варианты с каким-то Retry/Timeout MiddleWare дальше вникать лень сорри верю ты справишься
источник

CF

Cool 🦊 Fox in Scrapy
я главное понял куда копать, всем спасибо, буду форкать модуль и дописывать )
источник

BL

Boris Litvyakov in Scrapy
0_0
источник