Size: a a a

2020 September 08

iz

izzz zzi in Scrapy
Ну и дешевле выходит когда берёшь под что-то конкретное
источник

S

SoHard 🎄 in Scrapy
источник

S

SoHard 🎄 in Scrapy
зачем делать этот позор))
источник

iz

izzz zzi in Scrapy
источник
2020 September 09

A

Andrii in Scrapy
Доброе утро. В чем моя ошибка? https://pastebin.com/5W6cdwEY
источник

AR

Andrey Rahmatullin in Scrapy
а в чём проблема?
источник

A

Andrii in Scrapy
после логина, нужно перейти на другую страницу
def parse_after_login(self, response):
       url = 'https://www.cutsweats.com/leaderboard'
       yield scrapy.Request(url=url, callback=self.parse_table)
источник

AR

Andrey Rahmatullin in Scrapy
куки включи
источник

A

Andrii in Scrapy
они же по дефолту он?
источник

AR

Andrey Rahmatullin in Scrapy
да
источник

A

Andrii in Scrapy
тогда вкл
источник

AR

Andrey Rahmatullin in Scrapy
источник

B

Bulatbulat48 in Scrapy
Andrii
тогда вкл
дебаг кук можно включить, чтобы посмотреть правильно или нет работает
источник

B

Bulatbulat48 in Scrapy
без прокси юзаешь?
источник

A

Andrii in Scrapy
у меня в parse_after_login работает, а когда перехожу yield scrapy.Request(url=url, callback=self.parse_table), то parse_table уже без логина
источник

A

Andrii in Scrapy
прокси на уровне ОС
источник

AL

Alexey Lemeshevski in Scrapy
Ребята, чем вы убираете переносы строк и тэги?) ...я полжизни на Perl писал и мне привычно все делать регулярными выражениями. Но вдруг есть более быстрые (с точки зрения выполнения: нагрузки на цп, использования озу) варианты?)

Вижу, что переносы многие в питон убирают так: ' '.join( my_data.split() ) , но как-то громоздко ...и split все равно же, наверное re использует + временный массив создается в памяти ...имхо, sub(r'[\r\n\t]+', ' ') будет быстрее все же)

Тэги так: <[^>]+>
источник

A

Andrii in Scrapy
или можно сразу как то с
yield FormRequest.from_response(response, formdata={'csrf_token': csrf_token, 'username': '@gmail.com', 'password': 'password', 'reg_next': '/user/sign-in', 'next': '/'}, callback = self.parse_after_login
перейти на нужную мне страницу? тогда все будет ок :)
источник

AR

Andrey Rahmatullin in Scrapy
Alexey Lemeshevski
Ребята, чем вы убираете переносы строк и тэги?) ...я полжизни на Perl писал и мне привычно все делать регулярными выражениями. Но вдруг есть более быстрые (с точки зрения выполнения: нагрузки на цп, использования озу) варианты?)

Вижу, что переносы многие в питон убирают так: ' '.join( my_data.split() ) , но как-то громоздко ...и split все равно же, наверное re использует + временный массив создается в памяти ...имхо, sub(r'[\r\n\t]+', ' ') будет быстрее все же)

Тэги так: <[^>]+>
w3lib
источник

B

Bulatbulat48 in Scrapy
Alexey Lemeshevski
Ребята, чем вы убираете переносы строк и тэги?) ...я полжизни на Perl писал и мне привычно все делать регулярными выражениями. Но вдруг есть более быстрые (с точки зрения выполнения: нагрузки на цп, использования озу) варианты?)

Вижу, что переносы многие в питон убирают так: ' '.join( my_data.split() ) , но как-то громоздко ...и split все равно же, наверное re использует + временный массив создается в памяти ...имхо, sub(r'[\r\n\t]+', ' ') будет быстрее все же)

Тэги так: <[^>]+>
переносы и пробелы можно регуляркой
источник