Size: a a a

2019 December 21

PV

Pasha V in Scrapy
Всем привет. Есть ещё какие-нибудь ресурсы/чаты по web scrappingу?
источник

АП

Агент Печенька in Scrapy
Pasha V
Всем привет. Есть ещё какие-нибудь ресурсы/чаты по web scrappingу?
Ты буквально в таком чате.
источник

PV

Pasha V in Scrapy
Агент Печенька
Ты буквально в таком чате.
Обратил внимание, спасибо.
Есть ещё какие-либо ресурсы внутри телеграма? Каналы? Дополнительные чаты с обсуждениями?
источник

B

Bulatbulat48 in Scrapy
Pasha V
Обратил внимание, спасибо.
Есть ещё какие-либо ресурсы внутри телеграма? Каналы? Дополнительные чаты с обсуждениями?
по скрапи еще ресурсы, https://scrapy.org/community/
источник

КБ

Константин Белов in Scrapy
Всем привет. А есть книга про  фильтрацию данных?
На случай если много данных собрано, но они неструктурированные и хочется сделать нормальную бд шку или файл и них
источник

C

Cyberdine Engineering🐤 in Scrapy
Это называется feature engineering
источник
2019 December 22

R

Ricle in Scrapy
Всем привет, хелп, кто в парсинге на requests понимает, как делать запросы будто от авторизированного пользователя?
источник

AR

Andrey Rahmatullin in Scrapy
вронгчат, судя по всему
источник

R

Ricle in Scrapy
Andrey Rahmatullin
вронгчат, судя по всему
?
источник

AR

Andrey Rahmatullin in Scrapy
ну тут про скрапи, а не про ручной requests
источник

AR

Andrey Rahmatullin in Scrapy
а чтобы "делать запросы будто от авторизированного пользователя" надо куки передавать
источник

R

Ricle in Scrapy
я это делаю, только не работает (
источник

AR

Andrey Rahmatullin in Scrapy
это нормально
источник

AR

Andrey Rahmatullin in Scrapy
где куки берёшь?
источник

R

Ricle in Scrapy
в браузере,
источник

AR

Andrey Rahmatullin in Scrapy
они могли быть привязаны к этому браузеру
источник

AR

Andrey Rahmatullin in Scrapy
в идеале надо логиниться тем же скриптом, что и всё остальное делаешь, это ещё и проще (хаха ха)
источник

R

Ricle in Scrapy
я попітался все headers перетянуть в запрос
источник

AR

Andrey Rahmatullin in Scrapy
ну есть ещё вероятность что делао не в куках
источник

R

Ricle in Scrapy
Andrey Rahmatullin
в идеале надо логиниться тем же скриптом, что и всё остальное делаешь, это ещё и проще (хаха ха)
хех, там самая адская вещь, капча от гугл
источник