Size: a a a

2020 August 30

S

Spirit💎 in Scrapy
Максим Петров
to database
построчно пишешь или же при завершении краулера пачкой? какой объем нормально гонять через кролика, чтоб я сразу ограничение выставил)
источник

МП

Максим Петров... in Scrapy
I'm write one by one
источник

МП

Максим Петров... in Scrapy
on pages with list items just use objects.bulk_create
источник

S

Spirit💎 in Scrapy
понял, звучит не очень рационально для базы или я слишком заморачиваюсь
источник

МП

Максим Петров... in Scrapy
you're right
источник

МП

Максим Петров... in Scrapy
you can write all items in the ends of your spider
источник

К

Кирилл in Scrapy
Spirit💎
понял, звучит не очень рационально для базы или я слишком заморачиваюсь
Скорее всего слишком
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
Так, вопрос такой.
есть прокси, есть два сайта А И Б.
с сайта А все парсится через прокси.
С сайта Б Проиходит такое:
2020-08-30 18:14:24 [rotating_proxies.middlewares] WARNING: No proxies available; marking all proxies as unchecked
2020-08-30 18:14:24 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <403 https://xxx/api/9/items?categoryId=23&params%5B200%5D=1055&key=af0deccbgcgidddjgnvljitntccdduijhdinfgjgfjir&sort=date&locationId=637640&limit=50&priceMin=9000&priceMax=13000&owner%5B%5D=company&page=1>: HTTP status code is not handled or not allowed
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
что ему не нравится, при том что по этой ссылке и через браузер, и через обычный питон-реквест всё отдает
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
юзер-агента подключал
источник

A

Andrii in Scrapy
Может страна прокси в бане
источник

D•

Dan • Captain in Scrapy
Сейчас есть некоторые проблемы с интернетами глобально
источник

D•

Dan • Captain in Scrapy
Переслано от Oleg Makarikhin
Говорят какой-то пиздец у провайдеров
источник

D•

Dan • Captain in Scrapy
Переслано от Oleg Makarikhin
источник

D•

Dan • Captain in Scrapy
CenturyLink #ХЕРАКС
И в штатах как раз раннее утро воскресенья. Надеюсь, парни справятся с проблемой к понедельнику
источник

В

Владислав in Scrapy
Здравствуйте! Не подскажете можно ли спарсить этот сайт https://pinarello.com/bikes/
источник

AR

Andrey Rahmatullin in Scrapy
в чём вопрос?
источник

S

SoHard 🎄 in Scrapy
а почему нет?
источник

S

SoHard 🎄 in Scrapy
Dan • Captain
CenturyLink #ХЕРАКС
И в штатах как раз раннее утро воскресенья. Надеюсь, парни справятся с проблемой к понедельнику
а я думаю, чо у меня бот к базе не может достучаться
источник

S

Spirit💎 in Scrapy
господа, а из пайплайна при вызове close_spider нормальная идея запускать таск в селери? просто у меня он почему-то не запускается. но при этом сам спайдер запущен таском, может быть из-за этого?

upd. забыл вызвать delay() у таска, заработало.
источник