Size: a a a

2020 October 08

V

Victor in Scrapy
Стормпрокси - 35 баксов
источник

V

Victor in Scrapy
Или носок.орг - 90уе за 50 портов - у них 15к IPv4 ежедневные онлайн
источник

V

Victor in Scrapy
Ну или можно вообще IPv6 купить там еще будет дешевле
источник

Marat Мkhitаrуаn in Scrapy
SoHard 🎄
Подскажите еще пару сервисов подешевле где можно пул проксей использовать с авторотацией на каждый запрос
Скидывал выше
источник

Marat Мkhitаrуаn in Scrapy
это
источник

S

SoHard 🎄 in Scrapy
У меня сайт Тор отправляет по известному адресу
источник

V

Victor in Scrapy
SoHard 🎄
У меня сайт Тор отправляет по известному адресу
А пробовал самое простое - гугл.ботом представляться сайту? )
источник

A

Andrii in Scrapy
Victor
А пробовал самое простое - гугл.ботом представляться сайту? )
Гугл.ботом для гугла?
источник

V

Victor in Scrapy
Каков вопрос такой и ответ
источник

A

Andrii in Scrapy
SoHard 🎄
я на luminati сижу, там 0,6$/gb но может чо дешевле есть
Оплата за гб?
источник

S

SoHard 🎄 in Scrapy
Andrii
Оплата за гб?
Да
источник

AL

Alexey Lemeshevski in Scrapy
Andrii
Гугл.ботом для гугла?
Кстати, интересно, как он отреагировал бы))))

Или Яндексом... "Гугл, я пришел к тебе. Твой Яндекс" )))

По-хорошему, правильная система защиты должна гугл/яндекс по списку ip проверять) Яндекс где-то дает ссылку на список ip. Как раз, чтобы такие прикидывания не срабатывали)
источник

AR

Andrey Rahmatullin in Scrapy
правильная система защиты на юзерагент смотреть и не будет
источник

S

SoHard 🎄 in Scrapy
Alexey Lemeshevski
Кстати, интересно, как он отреагировал бы))))

Или Яндексом... "Гугл, я пришел к тебе. Твой Яндекс" )))

По-хорошему, правильная система защиты должна гугл/яндекс по списку ip проверять) Яндекс где-то дает ссылку на список ip. Как раз, чтобы такие прикидывания не срабатывали)
забанил бы сразу
источник

S

SoHard 🎄 in Scrapy
яндекс не должен индексировать то что обычно парсят
источник

S

SoHard 🎄 in Scrapy
оно и в robots заблочено
источник
2020 October 09

Marat Мkhitаrуаn in Scrapy
Andrey Rahmatullin
и я там забыл один пункт, оно spider.crawler.engine.schedule
Когда так добавляет это в обход тротлинга происходит?
источник

AR

Andrey Rahmatullin in Scrapy
Marat Мkhitаrуаn
Когда так добавляет это в обход тротлинга происходит?
В обход это как? Троттлинг применяется при отправке запроса
источник

Marat Мkhitаrуаn in Scrapy
то есть ограничения по тротлингу на него тоже распространяются?
источник

AR

Andrey Rahmatullin in Scrapy
Ну ты можешь рассказать что имеешь в виду
источник