Size: a a a

2020 January 13

AR

Andrey Rahmatullin in Scrapy
я уже написал, что пайплайн пишет не синхронно...
источник

AR

Andrey Rahmatullin in Scrapy
если посмотреть внимательно на пайплайн, в нём обнаружится функция, которая вызывается по разу на итем
источник

AR

Andrey Rahmatullin in Scrapy
и нет, она вызывается не когда паук завершается
источник

AR

Andrey Rahmatullin in Scrapy
откуда при асинхронности потеря данных это тоже вопрос
источник

in Scrapy
т.е. если вот такой код в скраппере в функции parse, ничего страшного не будет?
источник

in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
будет
источник

AR

Andrey Rahmatullin in Scrapy
ну т.е. не будет, вообще говоря, т.к. этот кусок выполняется синхронно
источник

AR

Andrey Rahmatullin in Scrapy
но делать так не стоит
источник

AR

Andrey Rahmatullin in Scrapy
и смысла 0, и механизмы получше уже есть, и развалится если внутри появится перевод управления
источник

AR

Andrey Rahmatullin in Scrapy
и с точки зрения отделения выковыривания итемов от их сохранения лучше код писать не так
источник

in Scrapy
ну тогда для пайпов мне нужно подкоректировать сеттинги, а у меня их не видит спайдер, может кто знает почему? (вот архитектура скрапера, или я хз что скинуть)
источник

in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
кого не видит спайдер?
источник

in Scrapy
settings, т.е. я ставлю там допустим DOWNLOAD_DELAY = 5, спайдер как буд-то игнорит это, если внутри самого спайдера custom_settings прописать download_delay:3 - слушается
источник

AR

Andrey Rahmatullin in Scrapy
ну и я блин ещё раз повторю, не пайплайны, а экспортеры
источник

AR

Andrey Rahmatullin in Scrapy
settings, т.е. я ставлю там допустим DOWNLOAD_DELAY = 5, спайдер как буд-то игнорит это, если внутри самого спайдера custom_settings прописать download_delay:3 - слушается
это не называется "не видит"
источник

AR

Andrey Rahmatullin in Scrapy
ну и если уж привык костылить custom_settings, то чо б остальное туда же не вписать
источник

AR

Andrey Rahmatullin in Scrapy
раз уж неохота с критичной проблемой разбираться
источник

in Scrapy
источник