Телеграмм чат группы scrapy

def parse_page(self, response):
  page_links = response.css('#body-container > div:nth-child(3) > div > div.rel.listHandler h3 a ::attr(href)').getall()
  yield from response.follow_all(page_links, callback = self.parse_ads)
  link_next_page = response.css('#body-container > div:nth-child(3) > div > div.pager.rel.clr > span.fbold.next.abs.large ::attr(href)').get()
  if link_next_page:
    yield from response.follow(link_next_page, callback = self.parse_page)
  else:
    pass

источник

18:25пожаловаться #6

Кирилл in Scrapy

можешь просто убрать else

источник

18:26пожаловаться #7

Alex in Scrapy

Кирилл

можешь просто убрать else

спасибо)

источник

18:27пожаловаться #8

Кирилл in Scrapy

и в follow() не нужен yield from, потому что это не генератор

источник

18:27пожаловаться #9

Кирилл in Scrapy

Мы то тебе подсказываем, но ты тоже разберись, потому что когда получаешь решение сразу, ты не поймешь, почему нужно именно так. И вот сейчас оно у тебя вылазит, что ты не понимаешь что происходит

источник

18:29пожаловаться #10

Кирилл in Scrapy

И это не про скрапи, а про питон в целом

источник

18:29пожаловаться #11

Alex in Scrapy

Кирилл

И это не про скрапи, а про питон в целом

с этим согласен
чет подзабыл я питон)
не то что бы я кодил супер много
но стоило забросить это дело на 3-4 месяца и какие то элементарные вещи вылетают из головы
спасибо еще раз за подсказки)

источник

18:31пожаловаться #12

i in Scrapy

Alex

есть функция

def parse(self, response):
  links = response.css('#body-container > div > div > div.clr.site-map a ::attr(href)').getall()
  for page in links:
    yield scrapy.Request(page, callback = self.parse_page)

в переменной links 100 ссылок
я ожидаю, что цикл будет передавать по одному значению в функцию parse_page ссылку и функция уже будет обрабатывать эту ссылку
поставил принт перед yield - и вижу что вываливается содержимое всей переменной links
почему так?

тока с follow_all надо еще не забывать yield from

источник

20:50пожаловаться #13

i in Scrapy

а, уже написали

источник

20:50пожаловаться #14

i in Scrapy

Alex

да разницы никакой собственно)
значит ок

ну ты можешь настройками выставить чтобы был приоритет на то, чтобы парсер шёл "вглубь", а не "вширь", но зачем...

источник