Size: a a a

2019 November 09

К

Кирилл in Scrapy
Константин Белов
что делать чтобы быстро и работало ?
Покупай приватные прокси, и чем больше тем быстрее
источник

E

Evgen in Scrapy
У гугла же подсеть известна
источник

КБ

Константин Белов in Scrapy
источник
2019 November 10

МС

Михаил Синегубов in Scrapy
можно, почему нельзя.
только вот вопроса не было, что именно нельзя.
по сабжу - там расписыватся настройка единичной прокси, без обработки ответа и мониторинга состояния.
на гитхабе есть, как минимум, несколько библиотек ротаторов прокси. Выбирай не хочу
источник
2019 November 11

МС

Михаил Синегубов in Scrapy
хай, народ
https://github.com/vimagick/dockerfiles/tree/master/scrapyd

пользовался кто? что скажете?

ну и, очередной, нубятский вопрос - надо запустить несколько инстансов scrapyd, через докер... подмогнете с информацией? 😋
источник

EB

Elisei Badanin in Scrapy
Михаил Синегубов
хай, народ
https://github.com/vimagick/dockerfiles/tree/master/scrapyd

пользовался кто? что скажете?

ну и, очередной, нубятский вопрос - надо запустить несколько инстансов scrapyd, через докер... подмогнете с информацией? 😋
у меня на одном серваке уже года 3 крутится, вроде работает бес проблем
источник

МС

Михаил Синегубов in Scrapy
Elisei Badanin
у меня на одном серваке уже года 3 крутится, вроде работает бес проблем
Спс за инфу...
источник
2019 November 12

A

AstralRomance in Scrapy
Насколько имеет смысл так делать:
Первым проходом заставить паука собрать ссылки на страницы товаров из категорий.
Вторым проходом - собрать со страниц товаров интересующую информацию.
Части информации, которую нужно собрать, на странице категории нет.
источник

МС

Михаил Синегубов in Scrapy
AstralRomance
Насколько имеет смысл так делать:
Первым проходом заставить паука собрать ссылки на страницы товаров из категорий.
Вторым проходом - собрать со страниц товаров интересующую информацию.
Части информации, которую нужно собрать, на странице категории нет.
ну, это только ты можешь ответить :)
а так, у меня, к примеру, овердохера вопросов возникает. В первую очередь вопрос "цена/качество". Под ценой и время то-же подразумевается. Если это для лично тебя, пользоваться тебе будет удобно, напишешь намного быстрее чем все в одном пауке - не вижу препятствий делать как ты написал.
источник

A

AstralRomance in Scrapy
Михаил Синегубов
ну, это только ты можешь ответить :)
а так, у меня, к примеру, овердохера вопросов возникает. В первую очередь вопрос "цена/качество". Под ценой и время то-же подразумевается. Если это для лично тебя, пользоваться тебе будет удобно, напишешь намного быстрее чем все в одном пауке - не вижу препятствий делать как ты написал.
Я интересуюсь, с целью улучшения результата. Мб оно совсем плохо, сильно замедлит работу и вообще фу-фу-фу так делать и есть намного более красивые альтернативы.
источник

A

AstralRomance in Scrapy
Мою ж писанину мб кто-то когда-то решит почитать, а может даже что-то в нее добавлять.
источник

МС

Михаил Синегубов in Scrapy
Понимаешь, ответить та твой вопрос можешь только ты. Это как ответить на "для торта надо ликер использовать?", сцуко, да рецептов 100500 мульёнов. Хер его знает, надо смотреть какой именно торт хочешь испечь.
Так и с твоим, хрен его знает, может по другому нельзя, а, может, ты полную херь сделал, и тебе надо руки отбить за это :)))
источник

E

Evgen in Scrapy
Я бы сказал, что если продуктов много, для отказоустойчивости и стабильности это имеет место быть. Плюс вы можете например разбивать продуктовый паук несколько (каждый паук может обрабатывать свою часть этих урлов)
источник

A

AstralRomance in Scrapy
Спасибо.
источник

EB

Elisei Badanin in Scrapy
>Я бы сказал, что если продуктов много, для отказоустойчивости и стабильности это имеет место быть
+++
источник

EB

Elisei Badanin in Scrapy
также может быть ситуация когда обновлять нужно
источник

EB

Elisei Badanin in Scrapy
в итоге одинпаук урлы из бд достает и обновляет, а второй только урлы новых товаров складывает
источник

КБ

Константин Белов in Scrapy
что я делаю не так ? (...
источник

AB

Anton Bakhankov in Scrapy
exit()
источник

AB

Anton Bakhankov in Scrapy
потом scrapy shell
источник