Size: a a a

2019 October 24

МС

Михаил Синегубов in Scrapy
брось сюда файл паука, тока именно сам файл, ненадо ничего никого копировать
источник

К

Кирилл in Scrapy
это почему вдруг не заходит
источник

Y

Yurii in Scrapy
Надо с оф сайта качать телегу просто
источник

К

Кирилл in Scrapy
у меня из Ubuntu Software и норм
источник

Y

Yurii in Scrapy
Из репозитория не работало, телефон пишешь и нифига не происходит
источник

EB

Elisei Badanin in Scrapy
Михаил Синегубов
вот объясни, нахрена тебе сейчас кластер? тебе надо обрабатывать десятки млн. ссылок в минуту/час? Тебе надо чекнуть сотни тысяч ссылок в течении нескольких минут?

в 99,999% кластер нахрен не впился. Вот когда будет задача под него, тогда и изучешь, ты сам скрапи еще не знаешь, как пайпы/мидлвари работают...
вот прям с языка снял…я тоже долго заморачивался над этим, сейчас в лучшем случае scrapyd а то и просто паук из когда пускаю….кластер нужен, когда просто индексируем весь инет и нет возможности поделить на мелкие задачи…и кластер это в первую очередь железо, на одной впс клакстер поднимать бессмылсенно
источник

К

Кирилл in Scrapy
yield items.load_item()
источник

МС

Михаил Синегубов in Scrapy
Кирилл
yield items.load_item()
так у него же не лоадер....
источник

К

Кирилл in Scrapy
Ай, не заметил
источник

МС

Михаил Синегубов in Scrapy
1. какая версия скрапи? у меня на extract материться
источник

МС

Михаил Синегубов in Scrapy
class QuotetutorialItem(scrapy.Item):
источник

МС

Михаил Синегубов in Scrapy
при объявлении сласса айтема, по моему, пролюбил наследование
источник

МС

Михаил Синегубов in Scrapy
class QuotetutorialItem(scrapy.Item):
   # define the fields for your item here like:
   title = scrapy.Field()
   author = scrapy.Field()
   tag = scrapy.Field()
источник

МС

Михаил Синегубов in Scrapy
3. импорт класса айтема лучше ИМХО делать абсолютным путем
from exist_crawl.items import QuotetutorialItem

exist_crawl - это имя моего проекта
источник

МС

Михаил Синегубов in Scrapy
в прЫнципе, вроде, все
источник

К

Кирилл in Scrapy
Михаил Синегубов
1. какая версия скрапи? у меня на extract материться
Это большая проблема, я хз где это берут, но постоянно легаси код, как будто доки и не открывали
источник

МС

Михаил Синегубов in Scrapy
Кирилл
Это большая проблема, я хз где это берут, но постоянно легаси код, как будто доки и не открывали
просто во всех туторах насован extract + extract_first, сам его раньше пользовал...
потом увидел "get" и экстракт уже лениво писать стало :)
источник

МС

Михаил Синегубов in Scrapy
PEP8 это не истина поледней инстанции, это РЕКОМЕНДАЦИИ для того, что бы код был единообразно оформлен
источник

К

Кирилл in Scrapy
сделать перенос, или разобрать на переменные
источник

М

Мак in Scrapy
::text только к последнему выражению применён
источник