Size: a a a

2020 October 11

AR

Andrey Rahmatullin in Scrapy
что такое проверяю вручную?
источник

КО

Константин Овечкин... in Scrapy
scrapy shell
источник

A

Andrii in Scrapy
Константин Овечкин
Подскажите возникает ошибка, когда из attrib пытаюсь получить по ключу значение, вылетает KeyError, когда проверяю вручную этот ключ есть и я могу вытащить данные. Что это может быть?
Код
источник

КО

Константин Овечкин... in Scrapy
Andrii
Код
источник

КО

Константин Овечкин... in Scrapy
Он большую часть отрабатывает, но иногда ловит error:
`2020-10-11 22:13:43 [scrapy.core.scraper] ERROR: Spider error processing <GET https://xn--80awqecag4e.xn--p1ai/shop/list/latunnyj/list-latunnyj-05x600x1500-l63-m-kopiya-ot-09012017-103948/> (referer: https://xn--80awqecag4e.xn--p1ai/shop/list/latunnyj/)
...
   price = response.css("div.price meta[itemprop='price']").attrib['content']
KeyError: 'content'`
источник

A

Andrii in Scrapy
Так на странице может нет атрибута
источник

КО

Константин Овечкин... in Scrapy
так я говорю, захожу через shell и проверяю, он есть.
источник

A

Andrii in Scrapy
А тьі еще напечатай респонс страниц
источник

A

Andrii in Scrapy
Сайт может блочить тебя
источник

КО

Константин Овечкин... in Scrapy
окей
источник

КО

Константин Овечкин... in Scrapy
сейчас гляну
источник

КО

Константин Овечкин... in Scrapy
спасибо
источник

КО

Константин Овечкин... in Scrapy
HostCMS session lock error: Timeout. Please wait!
источник

КО

Константин Овечкин... in Scrapy
правильно я понял, что можно полечить выставлением scrapy.contrib.downloadermiddleware.downloadtimeout.DownloadTimeoutMiddleware?
источник

Marat Мkhitаrуаn in Scrapy
Скорее всего слишком быстро парсите и сайт падает. Надо тротлинг добавить чтобы меньше запросов в секунду посылал иможет не будет падать.
источник

КО

Константин Овечкин... in Scrapy
да, я это понял. Я пытаюсь, найти что то стоковое в скрепи для этого.
источник

Marat Мkhitаrуаn in Scrapy
Autothrottling в скрапи есть
источник

КО

Константин Овечкин... in Scrapy
я пока поставил DOWNLOAD_DELAY = 0.3
источник

КО

Константин Овечкин... in Scrapy
так сейчас почитаю про тротлинг.
источник

AR

Andrey Rahmatullin in Scrapy
CONCURRENT_REQUESTS_*
источник