Size: a a a

2020 February 13

МС

Михаил Синегубов in Scrapy
Мак
кто нибудь знает, либа scrapy-puppeteer через прокси работает?
ну, судя по коду, в него только куки передаются
источник

М

Мак in Scrapy
Михаил Синегубов
ну, судя по коду, в него только куки передаются
кстати вопрос про куки... что то не могу их достать при использовании похожей либы scrapy-selenium...
response.headers - вообще пустые
response.request.cookies - тоже...
источник

М

Мак in Scrapy
чистый селениум что то не очень хочется подрубать сюда, походу придется сплеш пользовать, что ли...
источник

МС

Михаил Синегубов in Scrapy
        return HtmlResponse(
           self.driver.current_url,
           body=body,
           encoding='utf-8',
           request=request
       )
источник

МС

Михаил Синегубов in Scrapy
похоже их и никто не возвращает
источник

МС

Михаил Синегубов in Scrapy
пупитер, по идее, хидеры возвращает:
        return HtmlResponse(
           page.url,
           status=response.status,
           headers=response.headers,
           body=body,
           encoding='utf-8',
           request=request
       )
источник

МС

Михаил Синегубов in Scrapy
а скрапи-силениюм надо допиливать, с помощью нипильника и такой то матери...
источник

М

Мак in Scrapy
Михаил Синегубов
а скрапи-силениюм надо допиливать, с помощью нипильника и такой то матери...
нда... я там вопрос на гите про допиливание на работу через прокси задавал с год назад наверное уже..)) походу бросил либу разработчик. А так то хорошая либа
источник

МС

Михаил Синегубов in Scrapy
Мак
нда... я там вопрос на гите про допиливание на работу через прокси задавал с год назад наверное уже..)) походу бросил либу разработчик. А так то хорошая либа
Угу. У меня вообще не получилось заставить ее работать. Правда там сайт ипанутый, он мог рубить..
источник

М

Мак in Scrapy
Михаил Синегубов
Угу. У меня вообще не получилось заставить ее работать. Правда там сайт ипанутый, он мог рубить..
не, у меня везде работает. правда выполняет единственную функцию - запускает JS на страницах)))  а когда надо что то сложнее - приходится чистый селениум втыкать. получается жутко медленный костыль в итоге
источник

МС

Михаил Синегубов in Scrapy
Мак
не, у меня везде работает. правда выполняет единственную функцию - запускает JS на страницах)))  а когда надо что то сложнее - приходится чистый селениум втыкать. получается жутко медленный костыль в итоге
А почему для сложного не подходит?
источник

М

Мак in Scrapy
Михаил Синегубов
А почему для сложного не подходит?
ну прокси не поддерживает, куки достать не могу, кнопки не нажимает, если там какой то жуткий JS к кнопке привязан...
источник

МС

Михаил Синегубов in Scrapy
Так, а синениум через скрапи кнопки жмёт? Просто видел вроде примеры, что пупитер умеет кнопки жать. Я про чистый пупитер
источник

М

Мак in Scrapy
да, я как то делал половина сайта проходилась обычными реквестами скрапи, со скоостью света... а на последнем этапе включался селениум, долго предолго запускал гекодрайвер, нажимал кнопки, ждал реакции и собирал остаток инфы.
источник

МС

Михаил Синегубов in Scrapy
Мак
да, я как то делал половина сайта проходилась обычными реквестами скрапи, со скоостью света... а на последнем этапе включался селениум, долго предолго запускал гекодрайвер, нажимал кнопки, ждал реакции и собирал остаток инфы.
А, ок, понял
источник

М

Мак in Scrapy
если кто сталкивался, подскажите откуда
'Bearer' токен берется для подстановки в хедер
источник

EB

Elisei Badanin in Scrapy
откуда угодно может, обычно апи ключ
источник

AR

Andrey Rahmatullin in Scrapy
опенайди ещё
источник

М

Мак in Scrapy
Он, поросенок, меняется с неизвестной периодичностью, по крайней мере раз в сутки. А откуда он берётся, чтоб автоматизировать его добычу, что то не найду никак...
источник

AR

Andrey Rahmatullin in Scrapy
из запроса к апи
источник