Size: a a a

2019 December 19

in Scrapy
Кирилл
http://scrapyd:6800
источник

in Scrapy
теперь снова что-то новое
источник
2019 December 20

АМ

Алексей Мелолян in Scrapy
доброе утро. пытаюсь скрапить сайт https://pubs.rsc.org/en/journals/journalissues/cc#!recentarticles&adv , через сплэш пока не получается (руки не оттуда и опыта 0); я нашел документ, в котором передается необходимая инфа, но не понимаю как сделать запрос. подскажите пожалуйста, как его сформировать.
источник

АМ

Алексей Мелолян in Scrapy
источник

АМ

Алексей Мелолян in Scrapy
источник

АМ

Алексей Мелолян in Scrapy
источник

АМ

Алексей Мелолян in Scrapy
через copy as fetch тоже не получилось
источник

АМ

Алексей Мелолян in Scrapy
источник

МС

Михаил Синегубов in Scrapy
тебе пагинацию пройти? там через POST запросы, либо юзай scrapy.FromRequest (https://docs.scrapy.org/en/latest/topics/request-response.html#formrequest-objects), либо scrapy.Request с укащзанием типа запроса method='POST'
первое для тебя предпочтильнее, так проще будет
источник

АМ

Алексей Мелолян in Scrapy
Михаил Синегубов
тебе пагинацию пройти? там через POST запросы, либо юзай scrapy.FromRequest (https://docs.scrapy.org/en/latest/topics/request-response.html#formrequest-objects), либо scrapy.Request с укащзанием типа запроса method='POST'
первое для тебя предпочтильнее, так проще будет
если бы пагинация, там изначально приходит страница без информации, потом туда подгружаются нужные данные статей в файле, который на скриншоте, вот эти данные мне и не выдает
источник

АМ

Алексей Мелолян in Scrapy
я конечно понимаю, что селениум все это сожрет нормально, но тысячи статей скрапить будет до второго пришествия
источник

МС

Михаил Синегубов in Scrapy
ну, один фиг, там POST запрос, это и из твоего скрина видно
источник

АМ

Алексей Мелолян in Scrapy
да
источник

МС

Михаил Синегубов in Scrapy
ну, я уже сказал, посмотри FormRequest
источник

МС

Михаил Синегубов in Scrapy
оно именно POST и шлет
источник

АМ

Алексей Мелолян in Scrapy
попробовал сейчас и SplashFormRequest, и scrapy.FormRequest, не выдает, а пост запрос можно в шелл передать каким-то образом?
источник

АМ

Алексей Мелолян in Scrapy
вот респонс
источник

АМ

Алексей Мелолян in Scrapy
источник

АМ

Алексей Мелолян in Scrapy
def start_requests(self):
       yield scrapy.FormRequest(
           url= "https://pubs.rsc.org/en/journals/journalissues/cc#!recentarticles&adv",
           method='POST',
           callback=self.parse
       ) вот так запрос в пауке
источник

AR

Andrey Rahmatullin in Scrapy
А тело где
источник