Size: a a a

2019 December 20

AR

Andrey Rahmatullin in Scrapy
а вот тут уже нужно определиться с терминологией
источник

AR

Andrey Rahmatullin in Scrapy
одновременно в твоём представлении это как?
источник

AR

Andrey Rahmatullin in Scrapy
поток там один, но запросов параллельно - вплоть до CONCURRENT_REQUESTS
источник

К

Кирилл in Scrapy
Elena V
Я не нашла в доке о сути работы, что именно там асинхронное и где там потоки и как их померять.
Ты не найдешь этого в доках,  читай исходники
источник

EV

Elena V in Scrapy
Один процесс - один поток. Как понять сколько запросов идёт параллельно?
источник

AR

Andrey Rahmatullin in Scrapy
паук отдаёт операционке хттп-запрос и переключается на другие свои дела, когда придёт ответ от сервера - операционка сообщит пауку
источник

AR

Andrey Rahmatullin in Scrapy
Elena V
Один процесс - один поток. Как понять сколько запросов идёт параллельно?
никак
источник

AR

Andrey Rahmatullin in Scrapy
ну можно в очередь посмотреть и логирования добавить, наверно
источник

AR

Andrey Rahmatullin in Scrapy
но вообще это ж неважно
источник

EV

Elena V in Scrapy
Если перестану отвечать, значит я убилась об ступеньки, пока печатала на ходу
источник

EV

Elena V in Scrapy
Andrey Rahmatullin
но вообще это ж неважно
Да. Любопытно стало
источник

AR

Andrey Rahmatullin in Scrapy
Andrey Rahmatullin
поток там один, но запросов параллельно - вплоть до CONCURRENT_REQUESTS
ну вот официальный ответ
источник

AR

Andrey Rahmatullin in Scrapy
сколько именно в каждый момент времени висит в очереди - не логируется
источник

AR

Andrey Rahmatullin in Scrapy
если как показатель производительности, то rpm важнее
источник

EV

Elena V in Scrapy
Выходит зависит от сочетания двух переменных:
Скорость ответа сайта
Мощность моей машинки
источник

AR

Andrey Rahmatullin in Scrapy
мощность неважна
источник

AR

Andrey Rahmatullin in Scrapy
мощность как-то влияет на скорость парсинга, но это такие копейки по сравнению с ожиданием сервера
источник

AR

Andrey Rahmatullin in Scrapy
ну и вообще если очень много запросов откуда-то взять, то и скорость ответа сайта неважна, всегда в очереди будет CONCURRENT_REQUESTS запросов
источник

К

Кирилл in Scrapy
Andrey Rahmatullin
паук отдаёт операционке хттп-запрос и переключается на другие свои дела, когда придёт ответ от сервера - операционка сообщит пауку
Операционке?)
источник

AR

Andrey Rahmatullin in Scrapy
Andrey Rahmatullin
мощность как-то влияет на скорость парсинга, но это такие копейки по сравнению с ожиданием сервера
(если там нет ML, pdfminer и прочего сложного, а просто response.xpath)
источник