Size: a a a

2019 November 07

М

Мак in Scrapy
текст передается в зашифрованном виде под JS вида function(p,a,c,k,e,d)
источник

МС

Михаил Синегубов in Scrapy
Мак
текст передается в зашифрованном виде под JS вида function(p,a,c,k,e,d)
тогда ой :)
хотя, что нить вроде PyJS не подойдет? я про расшифровку...
но, это я так, поумничать :). По саму вопросу - ничего не скажу, ибо х/з, не пользовался.

Насчет глупостей, это да, это я про свой вопрос, был бы твой глупым - просто ткнул бы носом в ответ, типа "первой строчки в гугле" :))
источник

МС

Михаил Синегубов in Scrapy
а в чем конкретно проблема, в порядке заголовков или самих заголовках?
источник

М

Мак in Scrapy
В самих... Респонс хедерс передаёт хедеры твистед, а не сайта
источник

М

Мак in Scrapy
источник

М

Мак in Scrapy
Один в один мой вопрос, но мне этот луа скрипт не помогает
источник

A

AstralRomance in Scrapy
При запуске павука, пишет мне вот такие вещи:
twisted.internet.error.DNSLookupError: DNS lookup failed: no results for hostname lookup: https.

Что я делаю не так?
источник

AS

Alexander Serebrov in Scrapy
Мак
Один в один мой вопрос, но мне этот луа скрипт не помогает
да, но это единственный вариант) через splash.args прокинуть хидеры и забрать их в луа скрипте
источник

AS

Alexander Serebrov in Scrapy
https://github.com/scrapy-plugins/scrapy-splash#requests вот тут есть как их передать правильно
источник

М

Мак in Scrapy
да вроде бы итак вдоль и поперек это прочитал уже
источник

М

Мак in Scrapy
Alexander Serebrov
да, но это единственный вариант) через splash.args прокинуть хидеры и забрать их в луа скрипте
я ставил вторую страницу на первый проход, думал что в последующих страницах где то засада. но нет, первым проходом вторая страница прекрасно отрендерилась. а вот при пагинации следующие пустые оказались
источник

М

Мак in Scrapy
AstralRomance
При запуске павука, пишет мне вот такие вещи:
twisted.internet.error.DNSLookupError: DNS lookup failed: no results for hostname lookup: https.

Что я делаю не так?
http видимо надо,   а не https
источник

A

AstralRomance in Scrapy
Мак
http видимо надо,   а не https
В адресной строке https, попробовал http - не работает. Уже сделал как в туторе - не получается...
источник

М

Мак in Scrapy
AstralRomance
В адресной строке https, попробовал http - не работает. Уже сделал как в туторе - не получается...
а ошибки нет в строке адресной, типа http://https//www
источник

A

AstralRomance in Scrapy
Мак
а ошибки нет в строке адресной, типа http://https//www
Не, страница открывается нормально.
Я решил проблему со ссылкой, теперь пытаюсь выяснить, почему он мне файл не сохраняет и вообще в лог, который в методе parse сделан, ничего не пишет
источник

М

Мак in Scrapy
AstralRomance
Не, страница открывается нормально.
Я решил проблему со ссылкой, теперь пытаюсь выяснить, почему он мне файл не сохраняет и вообще в лог, который в методе parse сделан, ничего не пишет
значит лог неправильно оформлен
источник

A

AstralRomance in Scrapy
Вот такие вещи мне пишет...
источник

М

Мак in Scrapy
так правила для роботов то отключи))
источник

A

AstralRomance in Scrapy
ROBOTSTXT_OBEY = True Вот это можно прост закомментить?
источник

М

Мак in Scrapy
AstralRomance
ROBOTSTXT_OBEY = True Вот это можно прост закомментить?
False
источник