Size: a a a

2020 September 13

A

Alex in Scrapy
я запускаю паука с ключиком -о
-o result.json

в пауке данные собираю вот так
yield {
       'Phone': phone_number,
}
проблемка состоит в том, что данные пишет в файл хз как
то есть проходит минут 5, данные появились
вроде бы все ок но хотелось бы почаще, что бы сбрасывалась собранная информация в файл
нельзя как то влиять на этот процесс?
источник

К

Кирилл in Scrapy
Какая разница?
источник

A

Alex in Scrapy
да разницы никакой собственно)
значит ок
источник

ПА

Павел Асеев... in Scrapy
Привет, подскажите, а как сделать там чтобы например 1 item собирался с прошлой страницы (с реферера)? Например item['Город'] https://prnt.sc/ugjgw9 .
источник

iz

izzz zzi in Scrapy
Павел Асеев
Привет, подскажите, а как сделать там чтобы например 1 item собирался с прошлой страницы (с реферера)? Например item['Город'] https://prnt.sc/ugjgw9 .
meta?
источник

К

Кирилл in Scrapy
Это нормальное поведение записи в файл на уровне системы, оно пишет когда заполняется буфер, это сделанно для оптимизации. Если нужно, буфер можно убрать и оно в реал тайм будет записывать, но смысла в этом особого нет
источник

A

Alex in Scrapy
Кирилл
Это нормальное поведение записи в файл на уровне системы, оно пишет когда заполняется буфер, это сделанно для оптимизации. Если нужно, буфер можно убрать и оно в реал тайм будет записывать, но смысла в этом особого нет
понял, спасибо
источник

ПА

Павел Асеев... in Scrapy
Нет. Из HTML реферера.
источник

iz

izzz zzi in Scrapy
Павел Асеев
Нет. Из HTML реферера.
ну как понял тебе в парс детальный нужно передать город из предыдущей стр?
источник

ПА

Павел Асеев... in Scrapy
Это я понимаю ) Но как?)
источник

A

Andrii in Scrapy
Мета
источник

iz

izzz zzi in Scrapy
ну парсишь ее на предыдущей стр кидаешь в мету в детальном парсе дастаешь из меты)
источник

iz

izzz zzi in Scrapy
хотя там щас в новой есть еще что-то кроме меты, вроде рекомендуют в нее кидать
источник

iz

izzz zzi in Scrapy
Павел Асеев
Это я понимаю ) Но как?)
def page_parser(self, response):
   sites = hxs.select('//div[@class="row"]')
   items = []
   request =  Request("http://www.example.com/lin1.cpp",  callback =self.parseDescription1)
   request.meta['item'] = item
   return request

def parseDescription1(self,response):
   item = response.meta['item']
   item['desc1'] = "test"
   return item
источник

ПА

Павел Асеев... in Scrapy
Спасибо большое, буду пробовать 🙂
источник

iz

izzz zzi in Scrapy
вот
источник

iz

izzz zzi in Scrapy
Переслано от Bulatbulat48
Положить в мета, а в след функции извлечь из мета.
источник

iz

izzz zzi in Scrapy
Переслано от Bulatbulat48
источник

iz

izzz zzi in Scrapy
Переслано от Bulatbulat48
Либо через cb_kwargs в новых версиях
источник

К

Кирилл in Scrapy
источник