Size: a a a

2020 February 06

AR

Andrey Rahmatullin in Scrapy
а в первом наверно надо проверить что реактор поставился
источник

AR

Andrey Rahmatullin in Scrapy
в следующих версиях это всё конечно гораздо проще должно быть, но пока не
источник

r

rtme in Scrapy
Посоветуйте что почитать по scrapy для понимания общей картины с уклоном на майнинг промышленных масштабов.
источник

МС

Михаил Синегубов in Scrapy
Andrey Rahmatullin
на продакшен сайте тестил или на каком-нибудь простом?
какой именно сайт пытался спарсить?
именно мегаинедекс пробовал, и яндекс в качестве теста:).
ладн, намек понял, пошел учить матчасть 😄
источник

МС

Михаил Синегубов in Scrapy
rtme
Посоветуйте что почитать по scrapy для понимания общей картины с уклоном на майнинг промышленных масштабов.
что в твом понимании "промышленный масштаб"?
1. магазин на ~1,5 тыс позиций
2. инстаграмм, более 20 млн записей...
что из них считается промышленным?
источник

AR

Andrey Rahmatullin in Scrapy
3. broad crawl всего рунета
источник

r

rtme in Scrapy
Пару к магазинов например.
источник

AR

Andrey Rahmatullin in Scrapy
с одной структурой?
источник

r

rtme in Scrapy
Не один сайт, а разные, с разной структурой, автоматизация процесса, баг трекинг, конвейер
источник

r

rtme in Scrapy
Ну типа такого
источник

МС

Михаил Синегубов in Scrapy
rtme
Не один сайт, а разные, с разной структурой, автоматизация процесса, баг трекинг, конвейер
не обижайся, но вопрос похож на "мне купили комп, решил выкачать гугл, скажите как" :)
что в результате то должно быть? при чем туту и нафига багтрекинг, что за автоматизация? что за конвеер (не, ну я подозреваю что не завода Ford)
источник

r

rtme in Scrapy
Мне для понимания процесса
источник

r

rtme in Scrapy
Автоматизация: отслеживание отвалившихся, распаковка серваков, проксирование, добавление новых доноров.
источник

r

rtme in Scrapy
Короче серверная архитектура под это дело, и логирование на стероидах я полагаю с завязкой всего на scrapy
источник

r

rtme in Scrapy
Объяснил как смог
источник

МС

Михаил Синегубов in Scrapy
блин, такое ощущение, что ты незная вообще ничего пытаешся сделать кнопку "сделать красиво".
я бы разбил на такие куски
1. как работает скрапи, как им управлять
2. как написать сайт
3. что такое scrapyd
4. что такое bigdata
5. как и где хранить десятки млн записей
6. как и куда можно отпаравить сообщение
7. как сгенерить событие, которое отправит сообщение
источник

МС

Михаил Синегубов in Scrapy
но это мои измышления
источник

МС

Михаил Синегубов in Scrapy
а вообще, если задаешь настолько общие вопросы - ты просто не монимаешь в принципе что должно быть... и уж поверь, не стотит сейчас в это лезть. Начни с небольшого. С той же джанги и скрапи по отдельности
источник

r

rtme in Scrapy
Я задал нормальный общий вопрос, что почитать чтобы понять, че сразу какахами кидаться?
источник

МС

Михаил Синегубов in Scrapy
это я еще не кидался какахими 😂,  просто не пытайся слона из пистолета пристрелить "пойди вон, на кошках потренеруйся"© :)
просто ты пытаешся единовременно охватить совершенно разные области, а это тяжеловато
источник