Size: a a a

2020 January 15

AR

Andrey Rahmatullin in Scrapy
лол, автор видимо думает что timeout это задержка между запросами? а это не она
источник

AR

Andrey Rahmatullin in Scrapy
timeout (int) – Time, in seconds, to wait for the geocoding service to respond before raising a geopy.exc.GeocoderTimedOut exception.
источник

R

Roma in Scrapy
)))
источник

S

Sergey in Scrapy
нужно пропарсить много url из списка потоками, страницы имеют одинаковую структуру. где почитать в доках про это, как это называется?
источник

AR

Andrey Rahmatullin in Scrapy
я не понял
источник

AR

Andrey Rahmatullin in Scrapy
если структура одинаковая, то парсить их всех одним кодом, не?
источник

AR

Andrey Rahmatullin in Scrapy
где затруднение?
источник

S

Sergey in Scrapy
Andrey Rahmatullin
где затруднение?
в скорости парсинга, нужно запустить как можно большее кол-во потоков
источник

AR

Andrey Rahmatullin in Scrapy
сайт-то один?
источник

S

Sergey in Scrapy
Andrey Rahmatullin
сайт-то один?
нет
источник

AR

Andrey Rahmatullin in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
ну это не совсем про то, но
источник

AR

Andrey Rahmatullin in Scrapy
ну и плюс по джобу на ядро запустить, но всё равно поди в канал упрётся
источник

B

Bulatbulat48 in Scrapy
https://github.com/scrapy/scrapy/pull/4259/files
@wrar42
получается asyncio заменит какую-то часть и твистед будет для работы с сетью(не знаю как точнее сказать)?
источник

AR

Andrey Rahmatullin in Scrapy
и если урлов совсем много, надо думать как их батчить или хотя бы помнить, что уже попарсили, если джоб упадёт
источник

AR

Andrey Rahmatullin in Scrapy
Bulatbulat48
https://github.com/scrapy/scrapy/pull/4259/files
@wrar42
получается asyncio заменит какую-то часть и твистед будет для работы с сетью(не знаю как точнее сказать)?
нет, не заменит, всё что делается - только чтобы юзер мог юзать в юзерском коде либы типа aio*
источник

S

Sergey in Scrapy
Andrey Rahmatullin
ну и плюс по джобу на ядро запустить, но всё равно поди в канал упрётся
это как?
источник

AR

Andrey Rahmatullin in Scrapy
Sergey
это как?
ну несколько спайдеров
источник

AR

Andrey Rahmatullin in Scrapy
процессов
источник

S

Sergey in Scrapy
а в чем преймущество?
источник