Size: a a a

2020 January 26

L

Lex in Scrapy
Lex
она с каналами не работает
был не прав, с каналами работает, если извернуться )

Кому нужна помощь по ютубу - обращайтесь.
источник

Q

Qwelcer in Scrapy
Ребята как правильно распарсить только текст внутри <p> без стронг, а потом отдельно распарсить только <strong> - все без тегов?
источник

Q

Qwelcer in Scrapy
Делаю так, но забирает все что находится в div и в p
источник

AR

Andrey Rahmatullin in Scrapy
потому что надо XPath юзать
источник

Q

Qwelcer in Scrapy
Andrey Rahmatullin
потому что надо XPath юзать
точно, вспомнил. Спасибо
источник
2020 January 27

EV

Elena V in Scrapy
Qwelcer
Делаю так, но забирает все что находится в div и в p
У каждого элемента та есть свойство .text

Просто не помню сходу как достается в xpath и css:)

::text  - так что-ли
источник

AR

Andrey Rahmatullin in Scrapy
в xpath /text(), в css никак, ::text это расширение, которое только скрапи умеет
источник

МС

Михаил Синегубов in Scrapy
я бы сказал, не скрапи, а parsel, который в скрапи используется ;).
источник

AR

Andrey Rahmatullin in Scrapy
ну парсел раньше был частью скрапи, но да
источник

o

oneonwar in Scrapy
как бы забрать вот эти синие линии
источник

o

oneonwar in Scrapy
с гугл-панорам
источник

o

oneonwar in Scrapy
в запросах не нашел(
источник

i

ildar in Scrapy
есть 2 скрапера, каждый запускается через внешний скрипт путем
process = CrawlerProcess(s_ed)
process.crawl(spiderclasspath)
process.start()
я бы хотел запускать их последовательно из одного скрипта (т.к. второй паук полагается на полные результаты работы первого), запускаю последовательными import, а оно жалуется на то, что реактор twisted.internet.error.ReactorNotRestartable
источник

i

ildar in Scrapy
после process.start(), его как-то отдельно надо глушить? или наоборот может, надо как-то  использовать уже запущенный?
источник

i

ildar in Scrapy
нашел одно решение, надо сделать бочку: process.start(stop_after_crawl=False)
щас проверим)
источник

МС

Михаил Синегубов in Scrapy
у тебя два паука в одном проекте или два проекта?
источник

i

ildar in Scrapy
два проекта
источник

i

ildar in Scrapy
а стоп
источник

i

ildar in Scrapy
два паука в одном проекте!
источник

МС

Михаил Синегубов in Scrapy
так, стоямба
источник