Size: a a a

2020 January 28

V

Viktor in Scrapy
with open
источник

МС

Михаил Синегубов in Scrapy
в самом пауке файлы открываешь и пишешь?
источник

V

Viktor in Scrapy
в пайплайне
источник

AR

Andrey Rahmatullin in Scrapy
и какой код жрёт проц? на каждый итем открытие и закрытие файла?
источник

V

Viktor in Scrapy
да, на каждый итем
источник

МС

Михаил Синегубов in Scrapy
Viktor
да, на каждый итем
ипануться 😕😳, простите за матюки....
у тебя винт на первой космической работает
источник

МС

Михаил Синегубов in Scrapy
https://stackoverflow.com/questions/23868784/separate-output-file-for-every-url-given-in-start-urls-list-of-spider-in-scrapy

недавно бросал ссыль, но может и тебе пригодится
источник

МС

Михаил Синегубов in Scrapy
как ты думаешь, что быстрее
1. один раз открыть и писать, в конце закрыть
2. каждый раз : открыть, считать, добавить, записать, закрыть

во втором случае даже просто перечислять пункты долго :)
источник

V

Viktor in Scrapy
ну он же не считывает, создает файл, записывает все итемсы с этого урла и закрывает
источник

V

Viktor in Scrapy
но согласен что это костыли
источник

МС

Михаил Синегубов in Scrapy
ты, в первую очедь, реши для себя - действительно ли нужно тебе писать в разные файлы.
источник

V

Viktor in Scrapy
ну можно разбить по 5000 записей например, но пока ковыряюсь с этим решением)
источник

МС

Михаил Синегубов in Scrapy
и да, насколько я понял, у дефолтных экпортеров отложенная запись, но это не точно
источник

AR

Andrey Rahmatullin in Scrapy
синкнуть и закрыть файл это довольно дорого
источник

AR

Andrey Rahmatullin in Scrapy
Viktor
ну можно разбить по 5000 записей например, но пока ковыряюсь с этим решением)
всё ещё непонятно зачем
источник

МС

Михаил Синегубов in Scrapy
Viktor
ну можно разбить по 5000 записей например, но пока ковыряюсь с этим решением)
нафига? оно и пару млн. нормально запишет, и питон такое прочитает...
источник

V

Viktor in Scrapy
одна запись может занимать 10 мб, а таких 40 млн(
источник

МС

Михаил Синегубов in Scrapy
40 млн... а ты уверен что тебе файлы нужны. а не база?
источник

AR

Andrey Rahmatullin in Scrapy
и что точно нужно 10мб каких-то текстовых данных с одной страницы сайта
источник

V

Viktor in Scrapy
ну в идеале наверно с базой работать, но к этому я еще ползу)
источник