Size: a a a

2020 November 12

V

Victor in Scrapy
Bulatbulat48
попробуй выполни requests.Session()
Не выполнило
источник

AR

Andrey Rahmatullin in Scrapy
requests.__file__ теперь выполни
источник

V

Victor in Scrapy
Andrey Rahmatullin
requests.__file__ теперь выполни
В директирии репозитория
источник

AR

Andrey Rahmatullin in Scrapy
Victor
В директирии репозитория
что это такое?
источник

V

Victor in Scrapy
Andrey Rahmatullin
что это такое?
Там где проэкт стоит, файл создался
источник

AR

Andrey Rahmatullin in Scrapy
Не создался, а ты создал
источник

AR

Andrey Rahmatullin in Scrapy
Как я сразу и сказал, а ты развел тут
источник

B

Bulatbulat48 in Scrapy
@vick_25 в виртуальное окужение ставишь?
https://docs.python.org/3/tutorial/venv.html
источник

AR

Andrey Rahmatullin in Scrapy
И да, такие проблемы в питонбегиннерс
источник

S

SoHard 🎄 in Scrapy
Andrey Rahmatullin
Как я сразу и сказал, а ты развел тут
и оказалось что я правильно отправил)
источник

V

Victor in Scrapy
pipenv поломался у меня 😔
источник

A

Andrii in Scrapy
источник

A

Andrii in Scrapy
Можно вопрос? Создал я две нодЬІ с скрепид, загрузил на них один проект и циклом разделил список попалам. По идеи на каждую ноду пошло по 35 пауков. Но в Пендинг по каждой ноде общее число пауков
источник

V

Victor in Scrapy
извините за кипишь
источник

A

Andrii in Scrapy
почему так?
источник

i

i in Scrapy
Михаил Синегубов
всем доброго, пните, плз, в верном направлении.
Паук собираем данные в базу (MySQL), должен быть контроль уникальности (товар несколько раз присутствует в каталоге)
В холостую (без записи в базу) - ~4000 страниц в минуту
в боевом режиме - ~3000 страниц в минуту
так то 25% падение производительности....
что подскажите насчет ускорения? есть пара мыслей:
1. писать "сырые" данные в ту же монгу, потом преносить уже в базу с контролем уникальности
2. бросать данные на "прокладку", что то вроде Redis. т.е с одной сторны паук бросает данные и не ждет как они обработаются, а с другой стороны они потихоньку обрабатываются... Но тут я нубятина, почти полная. Не знаю, правильно я мыслю или полная ерись.

Так что, накидайте идеек :)
может быть еще попробовать постгрес. он как-то лучше с питоном работает.
источник

SS

Stepan Smirnov in Scrapy
https://apps.sfc.hk/edistributionWeb/api/news/content?refNo=19PR89&lang=EN

content = json.loads(response.text)
content['html']

Как скормить scrapy содержимое content['html'] чтобы можно было применять xpath/css?
источник

OS

Oleg Shleiko in Scrapy
Andrii
Можно вопрос? Создал я две нодЬІ с скрепид, загрузил на них один проект и циклом разделил список попалам. По идеи на каждую ноду пошло по 35 пауков. Но в Пендинг по каждой ноде общее число пауков
а покажи настройки, у тебя по ходу в работе максы 16 пауков
источник

AR

Andrey Rahmatullin in Scrapy
Stepan Smirnov
https://apps.sfc.hk/edistributionWeb/api/news/content?refNo=19PR89&lang=EN

content = json.loads(response.text)
content['html']

Как скормить scrapy содержимое content['html'] чтобы можно было применять xpath/css?
создать объект класса Selector
источник

SS

Stepan Smirnov in Scrapy
Andrey Rahmatullin
создать объект класса Selector
спасибо
источник