Size: a a a

2020 January 12

МС

Михаил Синегубов in Scrapy
у тебя наверняка юзерагент дефолтный
источник

AR

Andrey Rahmatullin in Scrapy
ну да, 403
источник

AR

Andrey Rahmatullin in Scrapy
сразу надо было лог читать, а не про xpath спрашивать
источник

M

Mikhail in Scrapy
User-agent закомментирован. Как 403 исправить подскажите пож-ста??
Как понять эту строчку? Ее в сеттингс вписать??
USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36'
источник

МС

Михаил Синегубов in Scrapy
Mikhail
User-agent закомментирован. Как 403 исправить подскажите пож-ста??
Как понять эту строчку? Ее в сеттингс вписать??
USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36'
ээээ, так может раскомментить?
ты комменты то читай ;)
источник

M

Mikhail in Scrapy
Mikhail
class ExampleSpider(scrapy.Spider):
   name = 'price_ozon'
   allowed_domains = ['price_ozon']
   start_urls = ['https://www.ozon.ru/category/nozhi-i-aksessuary-11463/']

   def parse(self, response):
       for div in response.xpath('//div[@class="a8p8 a8q6 a8q"]'):
           print('123')
           link=div.xpath('//div[@class="bn6 bn9"]')
           tittle = link.xpath('//span[@class="bx7 by"]/text()').get()

           yield {
               'tittle': tittle,
           }
Всем огромное спасибо за помощь!
С 403 разобрался, но теперь по итогу цикла все tittle пустые, чем это может быть вызвано??
источник

AR

Andrey Rahmatullin in Scrapy
я выше писал варианты
источник

M

Mikhail in Scrapy
Andrey Rahmatullin
а, ну как минимум не надо начинать xpath c //, если хочешь адресовать относительно элемента
А с какого символа необходимо начать, я просто во всех примерах видел именно с //? Я пробовал с //, / и без символов - результат один.
источник

AR

Andrey Rahmatullin in Scrapy
просто убрать //
источник

AR

Andrey Rahmatullin in Scrapy
ну это если путь правильный
источник

AR

Andrey Rahmatullin in Scrapy
а он неправильный
источник

AR

Andrey Rahmatullin in Scrapy
попробуй .//
источник

AR

Andrey Rahmatullin in Scrapy
во всех примерах с // потому что это не примеры поиска от конкретного элемента
источник

МС

Михаил Синегубов in Scrapy
Andrey Rahmatullin
во всех примерах с // потому что это не примеры поиска от конкретного элемента
ну, я бы поспорил с данным утверждением...
это же, по сути "слева похрен что", в смысле элемент и т.п.
источник

AR

Andrey Rahmatullin in Scrapy
// это "от корня документа"
источник

M

Mikhail in Scrapy
import scrapy


class ExampleSpider(scrapy.Spider):
   name = 'price_ozon'
   allowed_domains = ['price_ozon']
   start_urls = ['https://www.ozon.ru/category/nozhi-i-aksessuary-11463/']

   def parse(self, response):
       for div in response.xpath('.//div[@class="a8p8 a8q6 a8q"]'): #response.xpath('//div[@calss="a8p8.a8q6.a8q"]').getall(): response.css('div.b4z9'):
           #print('123')
           link=div.xpath('.//div[@class="bn6 bn9"]')
           tittle = div.xpath('.//span[@class="bx7 by"]/text()').get()

           yield {
               'tittle': tittle,
           }
тоже самое 😩
источник

M

Mikhail in Scrapy
а что значит путь неправильный??
источник

AR

Andrey Rahmatullin in Scrapy
неважно
источник

AR

Andrey Rahmatullin in Scrapy
в response.xpath не надо было точку вставлять
источник

M

Mikhail in Scrapy
Andrey Rahmatullin
в response.xpath не надо было точку вставлять
Да, я так сначала сделал - тоже пустые
источник