Телеграмм чат группы scrapy

https://stackoverflow.com/questions/23868784/separate-output-file-for-every-url-given-in-start-urls-list-of-spider-in-scrapy

немножно ректальный метод....

меня, кстати, больше интеерует вопрос, почему никто не озадачился дедлением больших объемов по количеству строк....?

Stack Overflow

Separate output file for every url given in start_urls list of spider in scrapy

I want to create separate output file for every url I have set in start_urls of spider or somehow want to split ouput files start url wise.

Following is the start_urls of my spider

start_urls = [...

источник

17:09пожаловаться #4

ildar in Scrapy

хз, наверно когда начинаются убер-пром-объемы, уже пихают в какую-нибудь базу, а уже оттуда нарезают как хотят. С другой стороны - нужна база.

источник

17:19пожаловаться #5

Mihail Sitnic in Scrapy

Привет! Подскажите что я делаю не так?
https://gist.github.com/mihailsitnic/ec51cff383c7f82b59ab21d7fa496147

Gist

Maestro.py

GitHub Gist: instantly share code, notes, and snippets.

источник

19:20пожаловаться #6

Andrey Rahmatullin in Scrapy

вызываешь функцию, а результат игнорируешь

источник

19:21пожаловаться #7

Andrey Rahmatullin in Scrapy

это главная проблема

источник

19:21пожаловаться #8

Mihail Sitnic in Scrapy

Подскажи пожалуйста как её переписать?

источник

19:22пожаловаться #9

Andrey Rahmatullin in Scrapy

возьми туториал, сделай аналогично

источник

19:23пожаловаться #10

Andrey Rahmatullin in Scrapy

официальный

источник

19:23пожаловаться #11

Mihail Sitnic in Scrapy

Спасибо )

источник

19:23пожаловаться #12

2020 January 28

Sergey in Scrapy

есть варианты как записать har-сессию запросов модуля requests?

источник

12:56пожаловаться #13

Sergey in Scrapy

надо как-то записать запросы парсера, чтобы можно было потом просмотреть charles'ом каким-нибудь

источник

12:57пожаловаться #14

Sergey in Scrapy

парсер работает на vps, туда mitm-proxy не вариант ставить

источник

13:02пожаловаться #15

Sergey in Scrapy

можно tcpdump'ом записать трафик, но просматривать нормаль и рееплееть запросы не получается

источник

13:03пожаловаться #16

Sergey in Scrapy

вообще есть какой-то набор инструментов, если у меня произошел сбой при парсинге и хочу воспроизсти это чтобы задебажить?

источник

13:04пожаловаться #17

ildar in Scrapy

а встроенный кэш скрапи не поможет? или там яваскрипт какой-нибудь еще есть? А вообще вроде splash умеет писать har

источник

13:13пожаловаться #18

Viktor in Scrapy

всем привет, только начал изучать скрапи.
настроил правила по поиску ссылок:
1. пагинация
2. ссылки на контент
И вот вопрос как сразу сохранить найденные ссылки на контент на страницах пагинации, чтобы потом использовать этот список и не парсить повторно при следующих обходах
И как отследить ошибки загрузки страниц с пагинацией?

источник

17:27пожаловаться #19

Andrey Rahmatullin in Scrapy

По первому - сделать два отдельных паука

источник

17:28пожаловаться #20