Size: a a a

2020 August 24

AR

Andrey Rahmatullin in Scrapy
иначе порядок не гарантируется
источник

А

Артем in Scrapy
Я так понимаю, что надо ждать, пока пофиксят последнюю версию?
источник

AR

Andrey Rahmatullin in Scrapy
да
источник

А

Артем in Scrapy
Хорошо, спасибо Вам большое!
источник

A

Andrii in Scrapy
будет что-то интересное в новой версии скрапи?)
источник

AR

Andrey Rahmatullin in Scrapy
смотря в которой
источник

AR

Andrey Rahmatullin in Scrapy
хттп/2 будет, надеюсь
источник

AR

Andrey Rahmatullin in Scrapy
и асинк start_requests с починкой алгоритма очереди
источник

KS

Kirill Sosnovskii in Scrapy
Kirill Sosnovskii
У меня есть что-то вроде такого кода:

for url in urls:
     yield response.follow(url, callback=self.parse_category)

yield Request(another_url, callback=self.parse_another_url, priority=1)

Если я хочу, чтобы полностью выполнились response.follow, и только после них просто Request, достаточно вот этого priority=1?
на основе вот этого кода выше....

Я могу использовать общий кеш для этих двух функций? Допустим, глобально в модуле объявить CACHE = set(), и в них проверять x in CACHE?
источник

AR

Andrey Rahmatullin in Scrapy
не надо ничего в модуле объявлять
источник

AR

Andrey Rahmatullin in Scrapy
уж лучше в спайдере, но осторожно
источник

f

fatklass in Scrapy
Со scrapy_proxies как то можно юзать no_proxy?
источник

f

fatklass in Scrapy
Я про класс RandomProxy от aivarsk
источник

ГЧ

Гнида Черножопая... in Scrapy
Хочу ловить обновления на сайте при клике на кнопку, буду юзать для этого селениум, мне нужно с помощью beautifulsoup ловить обновления? Или с помощью селениума? Как правильнее?
источник

К

Кирилл in Scrapy
Гнида Черножопая
Хочу ловить обновления на сайте при клике на кнопку, буду юзать для этого селениум, мне нужно с помощью beautifulsoup ловить обновления? Или с помощью селениума? Как правильнее?
селениума
источник

ГЧ

Гнида Черножопая... in Scrapy
Кирилл
селениума
Благодарю вас
источник

A

Andrii in Scrapy
Гнида Черножопая
Хочу ловить обновления на сайте при клике на кнопку, буду юзать для этого селениум, мне нужно с помощью beautifulsoup ловить обновления? Или с помощью селениума? Как правильнее?
Обновление чего? Возможно вообще не нужно браузер для етого
источник

ГЧ

Гнида Черножопая... in Scrapy
Andrii
Обновление чего? Возможно вообще не нужно браузер для етого
там если обновлять страницу - это занимает больше времени на прогрузку, а если юзать браузер - то нужно всего-лишь нажать кнопку
источник

A

Andrii in Scrapy
Гнида Черножопая
там если обновлять страницу - это занимает больше времени на прогрузку, а если юзать браузер - то нужно всего-лишь нажать кнопку
Какую кнопку?
источник

ГЧ

Гнида Черножопая... in Scrapy
Andrii
Какую кнопку?
Ну на сайте есть кнопка, нажимаешь и новые обновления на сайте подгружаются
источник