Size: a a a

2020 February 11

КБ

Константин Белов in Scrapy
ребят, а есть учебник по всем инструментам scrapinghub ?
источник

AR

Andrey Rahmatullin in Scrapy
это по каким?
источник

КБ

Константин Белов in Scrapy
ну какуюнибудь крутую и понятную, типо как спарсить о чистить весь интернет
источник

AR

Andrey Rahmatullin in Scrapy
вряд ли
источник

МС

Михаил Синегубов in Scrapy
@wrar42 пинг
источник

AR

Andrey Rahmatullin in Scrapy
А
источник

МС

Михаил Синегубов in Scrapy
к тебе вопрос как наибольшему (наверное) гуру скрапи :), ща опишу
источник

МС

Михаил Синегубов in Scrapy
ImagePipeline
я правильно понимаю
1. отправляем 100500 ссылок качать картинки
2. оно именно по ссылке определяем куда отдавать ответ....
источник

МС

Михаил Синегубов in Scrapy
так?
источник

МС

Михаил Синегубов in Scrapy
ибо у меня нет других объяснений моему вчерашнему вопросу, который я 7 февраля задавал
источник

МС

Михаил Синегубов in Scrapy
суть, примерно, такая
примерно 3 000 товаров
на них все, примерно, 900 картинок
каринки именуются по артикулу (имя файла = артикул+уникальный номер)

так эта зараза, даже если сказать dont_filter = true , все равно создает только 900 файлов и в одном айтеме название файлов перемешанные...
источник

AR

Andrey Rahmatullin in Scrapy
ничего про ImagePipeline не знаю
источник

AR

Andrey Rahmatullin in Scrapy
что такое отдавать ответ?
источник

МС

Михаил Синегубов in Scrapy
результат, который попадает в "item_completed"

ну, если не знаешь, то Ок, надо покопаться в скрапи :). У меня такая ситуация первый раз, хоть в дурку поезжай, почему оно перемешивает имена....
источник

AR

Andrey Rahmatullin in Scrapy
в item_completed результат реквеста попадает
источник

AR

Andrey Rahmatullin in Scrapy
привязан через коллбэки твистеда
источник

МС

Михаил Синегубов in Scrapy
не, я про то...
источник

МС

Михаил Синегубов in Scrapy
        # Return cached result if request was already seen
       if fp in info.downloaded:
           return defer_result(info.downloaded[fp]).addCallbacks(cb, eb)
источник

МС

Михаил Синегубов in Scrapy
я кажись нашел почему такое твориться....
оно тупо, если файл качался, его второй раз не качает и отдает то, что раньше скачало :)
источник

МС

Михаил Синегубов in Scrapy
и никакие "dont_filter=true" не спасут...
источник