Size: a a a

2019 December 11

К

Кирилл in Scrapy
Бывает, что такого
источник

AB

Alexander B in Scrapy
А он ретрай там сделает ?)
источник

AB

Alexander B in Scrapy
Или скипает просто?
источник

К

Кирилл in Scrapy
301 это редирект, ретрайа не будет
источник

К

Кирилл in Scrapy
Будет редирект
источник

К

Кирилл in Scrapy
Всех кодов не помню, но повторы идут только от 400+
источник

AB

Alexander B in Scrapy
2019-12-11 17:25:59 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <B> from <A>
источник

AB

Alexander B in Scrapy
A == B у меня
источник

AB

Alexander B in Scrapy
это могут быть оборонительная автоматика сайта?
источник

К

Кирилл in Scrapy
90% что нет
источник

AB

Alexander B in Scrapy
спасибо, погрепал получше, айтемы таки забираются
источник

AB

Alexander B in Scrapy
еще такой вопрос: kernel киляет мой проект с несколькими пауками (Out of memory: Kill process), в результате половина из них не завершаются. Что можно подкрутить в scrapy чтобы избежать такого?
источник

К

Кирилл in Scrapy
Оптимизировать код, чтоб он не держал много данных в памяти, уменьшить число конкурентности, докупить RAM
источник

АП

Агент Печенька in Scrapy
Alexander B
еще такой вопрос: kernel киляет мой проект с несколькими пауками (Out of memory: Kill process), в результате половина из них не завершаются. Что можно подкрутить в scrapy чтобы избежать такого?
Фикси код, он памяти много ест.
источник

AB

Alexander B in Scrapy
эх, попробую, а вот здесь ниче не поможет?)
источник

К

Кирилл in Scrapy
Используй генераторы, вместо больших списков, не тащи через код большие переменные и т.д.
источник

МС

Михаил Синегубов in Scrapy
Alexander B
эх, попробую, а вот здесь ниче не поможет?)
по умолчанию там 16 потоков, обычно приходится повышать, для скорости, иногда понижать из-за защиты (если без проксей). Но уж точно не понижать из-за нехватки ресурсов... Так что смотри что там у тебя в коде
источник

AB

Alexander B in Scrapy
да, похоже узкое место в моем pipeline, я там гененрирую кастомный xml через ET😇
источник
2019 December 12

OM

Oleg Maccen in Scrapy
Есть парсер на node js кто может поправить перестали парсить правильно
источник

OM

Oleg Maccen in Scrapy
Oleg Maccen
Есть парсер на node js кто может поправить перестали парсить правильно
Парсил магазины etsy.com а потом перестал, видать изменили в коде что-то
источник