Size: a a a

2020 September 13

S

SoHard 🎄 in Scrapy
i
Хотя кого я обманываю, пусть там хоть 30 букв будет, все равно пичарм автодополняет
+ещё tabnine
источник

S

SoHard 🎄 in Scrapy
Он сразу кусками кода дополняет
источник
2020 September 14

ss

san_ sarabat in Scrapy
Подскажите, как нужно сделать. У меня когда парсятся даные с сайта один раз поле парситься одлин раз приходит None, как мне сделать чтобы оно делало повторный запрос, или так нельзя?
источник

S

SoHard 🎄 in Scrapy
san_ sarabat
Подскажите, как нужно сделать. У меня когда парсятся даные с сайта один раз поле парситься одлин раз приходит None, как мне сделать чтобы оно делало повторный запрос, или так нельзя?
источник

ss

san_ sarabat in Scrapy
Спасибо! Сейчас буду смотреть
источник

ss

san_ sarabat in Scrapy
Сделал все как в статье неработает, код незаходит в переопеределенный мидлвеар
class CustomRetryMiddleware(RetryMiddleware):

   def process_response(self, request, response, spider):
       print('------------------')
       if request.meta.get('dont_retry', False):
           return response
       if response.status in self.retry_http_codes:
           reason = response_status_message(response.status)
           return self._retry(request, reason, spider) or response

       if response.status == 200 and response.xpath(spider.retry_xpath):
           return self._retry(request, 'response got xpath "{}"'.format(spider.retry_xpath), spider) or response
       return response
источник

ss

san_ sarabat in Scrapy
ето в моем пауке
def parse(self, response):
   item = News()
   for ul in response.xpath('//ul[@class="My(0) Ov(h) P(0) Wow(bw)"]'):
       item['link'] = self.HOST + ul.xpath('//div/div/div[@class="Ov(h) Pend(44px) Pstart(25px)"]/h3/a/@href').get()
       NewsSpider.retry_xpath = item['link']
       item['title'] = ul.xpath('//div/div/div[@class="Ov(h) Pend(44px) Pstart(25px)"]/h3/a/text()').get()
       NewsSpider.retry_xpath = item['title']
   return item
источник

К

Кирилл in Scrapy
san_ sarabat
ето в моем пауке
def parse(self, response):
   item = News()
   for ul in response.xpath('//ul[@class="My(0) Ov(h) P(0) Wow(bw)"]'):
       item['link'] = self.HOST + ul.xpath('//div/div/div[@class="Ov(h) Pend(44px) Pstart(25px)"]/h3/a/@href').get()
       NewsSpider.retry_xpath = item['link']
       item['title'] = ul.xpath('//div/div/div[@class="Ov(h) Pend(44px) Pstart(25px)"]/h3/a/text()').get()
       NewsSpider.retry_xpath = item['title']
   return item
Для вставки кода используй pastebin.com
источник

ss

san_ sarabat in Scrapy
Кирилл
Для вставки кода используй pastebin.com
Окей
источник

B

Bulatbulat48 in Scrapy
или можешь обратными кавычками по три штуки обрамлять код:
class CustomRetryMiddleware(RetryMiddleware):

   def process_response(self, request, response, spider):
       print('------------------')
       if request.meta.get('dont_retry', False):
           return response
       if response.status in self.retry_http_codes:
           reason = response_status_message(response.status)
           return self._retry(request, reason, spider) or response

       if response.status == 200 and response.xpath(spider.retry_xpath):
           return self._retry(request, 'response got xpath "{}"'.format(spider.retry_xpath), spider) or response
       return response
источник

ss

san_ sarabat in Scrapy
Кирилл
Для вставки кода используй pastebin.com
Типо вставлять туда код и кидать ссылку?
источник

ss

san_ sarabat in Scrapy
Bulatbulat48
или можешь обратными кавычками по три штуки обрамлять код:
class CustomRetryMiddleware(RetryMiddleware):

   def process_response(self, request, response, spider):
       print('------------------')
       if request.meta.get('dont_retry', False):
           return response
       if response.status in self.retry_http_codes:
           reason = response_status_message(response.status)
           return self._retry(request, reason, spider) or response

       if response.status == 200 and response.xpath(spider.retry_xpath):
           return self._retry(request, 'response got xpath "{}"'.format(spider.retry_xpath), spider) or response
       return response
Спасибо
источник

К

Кирилл in Scrapy
san_ sarabat
Типо вставлять туда код и кидать ссылку?
Да, ты просишь помощи и заставляешь людей вчитываться в эту кашу текста
источник

E

EFS in Scrapy
это еще хорошо что парсер смайликов не наставил в код 😭
источник

S

SoHard 🎄 in Scrapy
san_ sarabat
Сделал все как в статье неработает, код незаходит в переопеределенный мидлвеар
class CustomRetryMiddleware(RetryMiddleware):

   def process_response(self, request, response, spider):
       print('------------------')
       if request.meta.get('dont_retry', False):
           return response
       if response.status in self.retry_http_codes:
           reason = response_status_message(response.status)
           return self._retry(request, reason, spider) or response

       if response.status == 200 and response.xpath(spider.retry_xpath):
           return self._retry(request, 'response got xpath "{}"'.format(spider.retry_xpath), spider) or response
       return response
в настройках надо включить
источник

ss

san_ sarabat in Scrapy
SoHard 🎄
в настройках надо включить
SPIDER_MIDDLEWARES = {
   'scrapy.downloadermiddlewares.retry.RetryMiddleware': None,
   'scrapping.custom_middleware.CustomRetryMiddleware': 550,
   #'scrapping.middlewares.ScrappingSpiderMiddleware': 543,
}
RETRY_TIMES = 5
источник

S

SoHard 🎄 in Scrapy
san_ sarabat
ето в моем пауке
def parse(self, response):
   item = News()
   for ul in response.xpath('//ul[@class="My(0) Ov(h) P(0) Wow(bw)"]'):
       item['link'] = self.HOST + ul.xpath('//div/div/div[@class="Ov(h) Pend(44px) Pstart(25px)"]/h3/a/@href').get()
       NewsSpider.retry_xpath = item['link']
       item['title'] = ul.xpath('//div/div/div[@class="Ov(h) Pend(44px) Pstart(25px)"]/h3/a/text()').get()
       NewsSpider.retry_xpath = item['title']
   return item
а тут вообще бред какой-то
источник

S

SoHard 🎄 in Scrapy
даже переписать сложна
источник

S

SoHard 🎄 in Scrapy
с примера
источник

ss

san_ sarabat in Scrapy
SoHard 🎄
а тут вообще бред какой-то
я типо записал в айтемы
источник