Size: a a a

2020 January 16

E

Evgen in Scrapy
Я тут ге все прочитал
источник

E

Evgen in Scrapy
Уже сказали что из пайплайна можно дергать scrapy request?
источник

E

Evgen in Scrapy
Чтоб паук не блочился
источник

E

Evgen in Scrapy
self.crawler.engine.download(request, spider)
источник

A

Andriy in Scrapy
import requests
from bs4 import BeautifulSoup
import time

def get_html(url):
   ip = '37.123.222.124'
   proxies = {
       'http': f'{ip}:8080',
       'https': f'{ip}:8080',
   }

   r = requests.get(url, timeout=5, headers={
       'User-Agent': 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2224.3 Safari/537.36'},
                    proxies=proxies)
   return r.text


if name == "main":
   url = "https://www.kinopoisk.ru/film/1170018/"
   while 1:
       try:
           soup = BeautifulSoup(get_html(url), 'html.parser')
           print(soup.find('body'))
       except Exception as e:
           print("Except ", e)
           time.sleep(0.1)
           continue
источник

A

Andriy in Scrapy
Почему при парсинге выводится яндекс метрика, а не html код страницы?
источник

l

linuxoid in Scrapy
Метрика это не html code?
источник

B

Bulatbulat48 in Scrapy
Evgen
Чтоб паук не блочился
прикольно 👍
источник

МС

Михаил Синегубов in Scrapy
Evgen
Чтоб паук не блочился
хм, это, получается, блок в пределах конкретного айтема будет? точнее, в пределах этой процедуры?
источник

E

Evgen in Scrapy
Не будет блока. Создаете requuest с callback. И пихаете его в эту функцию. Как реквест отработает - коллбэк дернется. Как в обычном пауке
источник

VB

Vladyslav Babych in Scrapy
Всем привет, может кто скинуть код +- сложных пауков? Мне просто посмотреть
источник

МС

Михаил Синегубов in Scrapy
Vladyslav Babych
Всем привет, может кто скинуть код +- сложных пауков? Мне просто посмотреть
а что в твоем понятии "сложно"
источник

E

Evgen in Scrapy
сорян, чуть перепутал. crawler.engine.crawl вот эта
источник

VB

Vladyslav Babych in Scrapy
Михаил Синегубов
а что в твоем понятии "сложно"
Что-то сложней чем примеры из доки
источник

МС

Михаил Синегубов in Scrapy
Evgen
Не будет блока. Создаете requuest с callback. И пихаете его в эту функцию. Как реквест отработает - коллбэк дернется. Как в обычном пауке
ага, спс.
правда логика тогда ректальная получается.... но все равно спс
источник

МС

Михаил Синегубов in Scrapy
Vladyslav Babych
Что-то сложней чем примеры из доки
если я тебя в гитхаб пошлю - сильно обидешься? :)
источник

AR

Andrey Rahmatullin in Scrapy
Большинство сложных пауков не публикуют, думаю :)
источник

VB

Vladyslav Babych in Scrapy
Михаил Синегубов
если я тебя в гитхаб пошлю - сильно обидешься? :)
ну типо я там сейчас могу найти плохие примеры
источник

VB

Vladyslav Babych in Scrapy
хотелось бы хорошие
источник

МС

Михаил Синегубов in Scrapy
Vladyslav Babych
ну типо я там сейчас могу найти плохие примеры
нет плохих примеров, есть не правильное применение :))
источник