Size: a a a

2020 January 11

AR

Andrey Rahmatullin in Scrapy
Точнее про скорость  сервера с сайтом
источник

AR

Andrey Rahmatullin in Scrapy
16 ядер не нужны
источник

l

linuxoid in Scrapy
Я вилдберес парсил, женскую одежду, вот там мне повезло
источник

l

linuxoid in Scrapy
700к товаров за 6 часов спарсил благодаря мультипроцессингу
источник

l

linuxoid in Scrapy
Извините за офтоп
источник

АП

Агент Печенька in Scrapy
linuxoid
700к товаров за 6 часов спарсил благодаря мультипроцессингу
Примерно 1944 товара в минуту, скрапи такие числа выдаёт и даже не кашляет.
источник

l

linuxoid in Scrapy
Агент Печенька
Примерно 1944 товара в минуту, скрапи такие числа выдаёт и даже не кашляет.
Тогда надо попробовать
источник

l

linuxoid in Scrapy
Спасибо
источник

ЕJ

Евгений Jen in Scrapy
Агент Печенька
Примерно 1944 товара в минуту, скрапи такие числа выдаёт и даже не кашляет.
как то тестил мультипоточный скрипт на threading + select + lxml
против scrappy (прирост у scrappy только +20%)
источник

AR

Andrey Rahmatullin in Scrapy
ещё и прирост? круто
источник

ЕJ

Евгений Jen in Scrapy
да за исключением того что в скрипте прозрачно, а скраппи надо курить месяцами
источник

AR

Andrey Rahmatullin in Scrapy
🤷‍♂️
источник

AR

Andrey Rahmatullin in Scrapy
ничего на "threading + select" не может быть прозрачно
источник

ЕJ

Евгений Jen in Scrapy
ам ну тогда thread pool - куда еще проще)
источник

AR

Andrey Rahmatullin in Scrapy
в питон уже добавили публичный тредпул? :)
источник

AR

Andrey Rahmatullin in Scrapy
а, в 3.2
источник

AR

Andrey Rahmatullin in Scrapy
ну ок
источник

AR

Andrey Rahmatullin in Scrapy
а это всё без коллбэков или там наколеночный реактор написан?
источник

ЕJ

Евгений Jen in Scrapy
while true
+ 15 строк кода
источник

ЕJ

Евгений Jen in Scrapy
тред освободился, кормим ему новую ссылку
источник