Size: a a a

2019 November 27

МС

Михаил Синегубов in Scrapy
клево, полный фарш :))
теперь, блин, еще и сервис антикаптчи пополнить надо будет. Или вспомнить где я понарегался 😂
источник

JW

John Wayne in Scrapy
Bulatbulat48
так в чем проблема то? у тебя две страницы одна с JS-ом, вторая без. Парси какую хочешь. Вторая _escaped_fragment_ видимо уже протухла и на нее забили, судя по торчащему коду на странице. Это не защита, это хак. который устарел.
проблема в том что я не могу получить страницу с js, редиректит на _escaped_fragment_ страницу. И я не понимаю что изменить в урл, чтобы селениум открыл js страницу?(все пишут удали _escaped_fragment_ и получишь ту самую страницу, в этом случае это же не так)
источник
2019 November 28

B

Bulatbulat48 in Scrapy
John Wayne
проблема в том что я не могу получить страницу с js, редиректит на _escaped_fragment_ страницу. И я не понимаю что изменить в урл, чтобы селениум открыл js страницу?(все пишут удали _escaped_fragment_ и получишь ту самую страницу, в этом случае это же не так)
посылай правильные хедеры(эмулируя поведение браузера), какой UA шлешь с селениумом?
источник

B

Bulatbulat48 in Scrapy
скорее всего примерно такое правило:
if ($http_user_agent ~* "googlebot|bingbot|yandex|baiduspider|twitterbot|facebookexternalhit|rogerbot|linkedinbot|embedly|quora link preview|showyoubot|outbrain|pinterest|slackbot|vkShare|W3C_Validator") {
set $prerender 1;
}
источник

JW

John Wayne in Scrapy
Bulatbulat48
скорее всего примерно такое правило:
if ($http_user_agent ~* "googlebot|bingbot|yandex|baiduspider|twitterbot|facebookexternalhit|rogerbot|linkedinbot|embedly|quora link preview|showyoubot|outbrain|pinterest|slackbot|vkShare|W3C_Validator") {
set $prerender 1;
}
ua нормальный, дело в другом было
selenium_response = HtmlResponse(url=response.url, body=self.driver.page_source, encoding='utf-8') если так то в боди почему то идет _escaped_fragment_ страница, url=с решеткой тоже самое, а вот если url=test.com заглушка, то body правильный с Js
источник

B

Bulatbulat48 in Scrapy
John Wayne
ua нормальный, дело в другом было
selenium_response = HtmlResponse(url=response.url, body=self.driver.page_source, encoding='utf-8') если так то в боди почему то идет _escaped_fragment_ страница, url=с решеткой тоже самое, а вот если url=test.com заглушка, то body правильный с Js
Тоесть основной сайт без решетки?
источник

JW

John Wayne in Scrapy
Bulatbulat48
Тоесть основной сайт без решетки?
self.driver.get('https://www.fonbet.ru/#!/live/football') с решеткой, и просто заглушку в HtmlResponse(url=test.com, тогда все ок. Как там оно под капотом я хз
источник

Ф

ФСБ in Scrapy
Есть кто с селениумом работал?
источник

IM

Igor Moroz in Scrapy
задавай вопрос сразу)
источник

Ф

ФСБ in Scrapy
сюка, кто шарит в selenium ?
источник

Ф

ФСБ in Scrapy
мне нужно передать ёбанный параметр чтобы кликнуть по нему
источник

Ф

ФСБ in Scrapy
я беру нахуй захожу в код элемента
источник

Ф

ФСБ in Scrapy
вставляю классы, айдишники, ваще всё нахуй уже пробовал
источник

Ф

ФСБ in Scrapy
и нихуя не работает
источник

Ф

ФСБ in Scrapy
источник

Ф

ФСБ in Scrapy
сори за маты, подгорело
источник

Ф

ФСБ in Scrapy
уже полтора часа на эту кнопку нажать не могу
источник

Ф

ФСБ in Scrapy
вывод ошибки
источник

B

Bulatbulat48 in Scrapy
нет такого элемента
источник

К

Кирилл in Scrapy
Дело не в селениуме, пропиши нормально селектор
источник