Size: a a a

2019 October 31

i

ildar in Scrapy
вот кстати как-раз после того как я те сайты с лямом записей парсил с необходимостью кеша я от файликов и отказался))
источник

i

ildar in Scrapy
потому-что удалять несколько сот тысяч файликов даже на убер-быстром ssd это боль
источник

i

ildar in Scrapy
а leveldb создает штук 100 что-ли файликов, ну может тыщу
источник

МС

Михаил Синегубов in Scrapy
ildar
потому-что удалять несколько сот тысяч файликов даже на убер-быстром ssd это боль
та ладна, я на яндекс синхронизировался нечаянно в в пару сот тыс.... от это печаль 😂 он удаляет чуть ли не дольше чем заливает
источник

i

ildar in Scrapy
мде, ну да ладно, уйдем на DBM storage, надеюсь там не будет подводных камней и надо будет просто поставить и прописать одну строчку
источник

МС

Михаил Синегубов in Scrapy
народ, а давайте я чуть чуть потуплю
а что такое за зверь "DBM"?
источник

i

ildar in Scrapy
для меня это выглядит как база данных, похожая на leveldb, но старей)
источник

i

ildar in Scrapy
а вообще даже не база данных, а какой-то универсальный интерфейс
источник

i

ildar in Scrapy
и там есть реализации под линух и винду и еще быстрая и медленные какие-то.
источник

МС

Михаил Синегубов in Scrapy
https://ru.wikipedia.org/wiki/DBM
хм, это nosql что ли?
источник

i

ildar in Scrapy
источник

i

ildar in Scrapy
ну вроде да, ключ-значение, я так понял это из серии аля редис -мемкешед и прочих редисок
источник

i

ildar in Scrapy
там еще из интересных особенностей - значения надо в byte хранить
источник

МС

Михаил Синегубов in Scrapy
короче, надо применять метод научно обоснованного тыка, 😄
источник

i

ildar in Scrapy
я вот одного боюсь - в leveldb вроде как из-коробки была очень быстрая архивация "на-лету", называлась snappy, ну т.е. там главно это скорость архивации-разархивации, а не сжатие. ну и это байда от гугля, которую он сам использует в куче проектов, в т.ч. и для кеша хрома емнип.
источник

i

ildar in Scrapy
Боюсь как-бы не случилось того, что с этими dbm-реализациями либо размер кэша в стратосферу улетит, либо скорость упадет
источник

i

ildar in Scrapy
(хотя не факт что эта архивация работала в случае со скрапии, лол)
источник

К

Кирилл in Scrapy
ildar
чооооо, вот паразиты!
The LevelDB storage backend (scrapy.extensions.httpcache.LeveldbCacheStorage) of HttpCacheMiddleware is deprecated (issue 4085, issue 4092)
А почему просто не взять из старой версии? Если тебе с ней удобно то кто запретит
источник

i

ildar in Scrapy
они ж не просто так его дропают, там в питоне 3.8 какие-то ментейнеры из дебиана не хотят его ментейнить помушо он  старый и не компилится, причем это просто врапперы. может там кто-то просто психанул
источник

i

ildar in Scrapy
читаю детектив тут: https://github.com/scrapy/scrapy/pull/4092
источник