Size: a a a

2019 October 28

AS

Alexander Serebrov in Scrapy
Ещё могут быть «круговые» категории: кликаешь в неё и попадаешь снова в парент категорию, а оттуда снова доступна та же категория)) и ссылка все время меняется, дефолтный дупфильтр не ловит
источник

МС

Михаил Синегубов in Scrapy
Alexander Serebrov
Ещё могут быть «круговые» категории: кликаешь в неё и попадаешь снова в парент категорию, а оттуда снова доступна та же категория)) и ссылка все время меняется, дефолтный дупфильтр не ловит
мне тока поиск заюзать
источник

МС

Михаил Синегубов in Scrapy
https://shop.nordstrom.com/ - я на этом наелся пагинации. Некоторые разделы не смог победить от слова вообе....
источник

A

Andriy in Scrapy
Как можно спарсить информацию из сайта на русском языке?
источник

A

Andriy in Scrapy
def get_html(url):
   r = requests.get(url,
                    cookies={'lang': 'ru'})
   return r.content


soup = BeautifulSoup(get_html("https://help.uber.com/partners/section/как-пользоваться-приложением?nodeId=64904bd6-66ca-47e9-965d-324413079f5c"),'html.parser')
источник

К

Кирилл in Scrapy
Andriy
def get_html(url):
   r = requests.get(url,
                    cookies={'lang': 'ru'})
   return r.content


soup = BeautifulSoup(get_html("https://help.uber.com/partners/section/как-пользоваться-приложением?nodeId=64904bd6-66ca-47e9-965d-324413079f5c"),'html.parser')
Вроде выглядит нормально, а в чем проблема?
источник

A

Andriy in Scrapy
Кирилл
Вроде выглядит нормально, а в чем проблема?
Мне нужно чтоб парсило вопросы на русском языке, а оно парсит на английском
источник

К

Кирилл in Scrapy
Попробуй добавить хэдэр с языком
источник

К

Кирилл in Scrapy
Откуда ты взял lang, должно быть '__LOCALE__': 'ru-RU'
источник

A

Andriy in Scrapy
Кирилл
Откуда ты взял lang, должно быть '__LOCALE__': 'ru-RU'
Спасибо
источник
2019 October 29

М

Мак in Scrapy
stormwall кто нибудь сталкивался?
источник

G

Grigory in Scrapy
Мак
stormwall кто нибудь сталкивался?
Нет
источник

E

Evgen in Scrapy
там либо JS challenge либо просто привязать куки к IP
источник

М

Мак in Scrapy
Evgen
там либо JS challenge либо просто привязать куки к IP
splash прикручивать лучше?
источник

E

Evgen in Scrapy
Splash или что то типа js2py. Но опять же надо чтоб челендж решался с того же IP что и будет использоваться
источник

B

Bulatbulat48 in Scrapy
Мак
stormwall кто нибудь сталкивался?
ru сайт?)
источник

М

Мак in Scrapy
Bulatbulat48
ru сайт?)
да... но хостинг где то в теплых странах
источник

М

Мак in Scrapy
Bulatbulat48
ru сайт?)
причем не так давно прокси помогали - а теперь все прокси напроч отрубает. походу какой то злой JS применили теперь
источник

E

Evgen in Scrapy
Халява там обычно
источник
2019 October 30

EB

Elisei Badanin in Scrapy
А вы в скрапингхабе используете сплешь чтобы не палить скрапинг? Или это у меня паранойя?
источник