Телеграмм чат группы scrapy_python страница 1094

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

380 membersпожаловаться на группу

2020 January 22

A

Andrii in Scrapy

пока что спасибо

источник

16:38пожаловаться #1

AR

Andrey Rahmatullin in Scrapy

for sect in doc.xpath('//sect'): и поехали

источник

16:38пожаловаться #2

A

Andrii in Scrapy

иду читать

источник

16:39пожаловаться #3

AR

Andrey Rahmatullin in Scrapy

а xml ты кодом сделал или что-то готовое взял?

источник

16:41пожаловаться #4

A

Andrii in Scrapy

пересохранил ПДФ через адобе акробат ДЦ

источник

16:42пожаловаться #5

A

Andrii in Scrapy

просто кодом там ужас

источник

16:42пожаловаться #6

R

Адоб акробат будет лучшее решение для ПДФ, там же можно и сразу распознать текст

источник

16:43пожаловаться #7

A

Andrii in Scrapy

Адоб акробат будет лучшее решение для ПДФ, там же можно и сразу распознать текст

ПДФ уже как текст, но очень сложно определить где заголовок, где автор, а где текст :(

источник

16:44пожаловаться #8

A

Andrii in Scrapy

а так даже очень толково пересохранило в XML, структура очень приятна

источник

16:45пожаловаться #9

R

Ну да, ничего умнее чем у них, сложно найти для работы с пдф

источник

16:46пожаловаться #10

i

ildar in Scrapy

Xml кстати через скрапи очень удобно парсить, даже меньше кода придется писать, правда если с ним до этого не работал то сложновато будет

источник

16:58пожаловаться #11

Y

Yurii in Scrapy

Xml кстати через скрапи очень удобно парсить, даже меньше кода придется писать, правда если с ним до этого не работал то сложновато будет

В чем удобство?

источник

16:59пожаловаться #12

Y

Yurii in Scrapy

А то примеры что видел парсят через одно место и скрапи никак не помогает.

источник

17:00пожаловаться #13

МС

Михаил Синегубов in Scrapy

нормальный xml просто удобно пасрить 😂
а через чего....
в питоне же можно гулять по xml нодам без xpath? иногда такое даже удобнее (правда не часто)

источник

17:16пожаловаться #14

AR

Andrey Rahmatullin in Scrapy

ну да, lxml.etree умеет так

источник

17:18пожаловаться #15

i

ildar in Scrapy

Yurii

А то примеры что видел парсят через одно место и скрапи никак не помогает.

ну как, через scrapy XMLFeedSpider тебе не надо париться как-то с открытием его, или выделением item'ов, более того - он даже сам создает цикл и бегает по тому itertag, который ты указываешь, к примеру для yandex market xml это будет 'offer', там структура поле offers и в нем куча offer.
Если тебе надо какую-то штуку из другого места вытащить, то можно использовать adapt_response ( к примеру категории из того же yandex market xml)
Ну и все - вот у тебя 4 строчки и дальше ты уже xpath/css вытягиваешь айтемсы

источник

17:38пожаловаться #16

Y

Yurii in Scrapy

ну как, через scrapy XMLFeedSpider тебе не надо париться как-то с открытием его, или выделением item'ов, более того - он даже сам создает цикл и бегает по тому itertag, который ты указываешь, к примеру для yandex market xml это будет 'offer', там структура поле offers и в нем куча offer.
Если тебе надо какую-то штуку из другого места вытащить, то можно использовать adapt_response ( к примеру категории из того же yandex market xml)
Ну и все - вот у тебя 4 строчки и дальше ты уже xpath/css вытягиваешь айтемсы

Пример есть?

источник

17:39пожаловаться #17

AR

Andrey Rahmatullin in Scrapy

дак https://docs.scrapy.org/en/latest/topics/spiders.html#xmlfeedspider

источник

17:40пожаловаться #18

i

ildar in Scrapy

ну в принципе да, https://docs.scrapy.org/en/latest/topics/spiders.html#xmlfeedspider-example

источник

17:41пожаловаться #19

Y

Yurii in Scrapy

Почему же советуют совсем иное обычно

источник

17:42пожаловаться #20