Телеграмм чат группы scrapy

Всем привет, есть кто продаёт парсеры сайтов интересует work.ua, rabota.ua, olx, besplatka и подобные? Напишите в лс 🙏. Нужно собирать только номера телефонов

источник

07:19пожаловаться #6

N

Nikolay in Scrapy

Подскажите как правильно организовать сохранение большого количества хтмл страничек (> 100 000 ) которые разбросаны по всему сайту - т.е. нужно лазить по сайту и сохранять соответствующие фильтру страницы. Всего страниц 1кк+. Решил в лоб - в пауке сохраняю - но долго получается из-за блокировки при сохранении. Надумал в одном потоке парсить и найденное бросать на обработку в другой поток, но тогда все равно там задержка. Как можно, не знаю как правильно сказать, асинхронно или многопоточно в данном случае можно сохранить результат?

источник

10:52пожаловаться #7

OM

Oleg Maccen in Scrapy

Nikolay

Подскажите как правильно организовать сохранение большого количества хтмл страничек (> 100 000 ) которые разбросаны по всему сайту - т.е. нужно лазить по сайту и сохранять соответствующие фильтру страницы. Всего страниц 1кк+. Решил в лоб - в пауке сохраняю - но долго получается из-за блокировки при сохранении. Надумал в одном потоке парсить и найденное бросать на обработку в другой поток, но тогда все равно там задержка. Как можно, не знаю как правильно сказать, асинхронно или многопоточно в данном случае можно сохранить результат?

Можете сказать что такое паук?

источник

12:44пожаловаться #8

iz

izzz zzi in Scrapy

Oleg Maccen

Можете сказать что такое паук?

Spider

источник

12:46пожаловаться #9

OM

Oleg Maccen in Scrapy