Size: a a a

2020 October 07

VR

Vadim Ryzhkov in Scrapy
Спасибр
источник

A

Andrii in Scrapy
Нужна помощь-совет: есть в гугла такая штука как site:, вот, кто-может или как можно стянуть все урл отого site: ? Мне показует только 30 стр., можно достать больше?
источник

G

Georgiy in Scrapy
Andrii
Нужна помощь-совет: есть в гугла такая штука как site:, вот, кто-может или как можно стянуть все урл отого site: ? Мне показует только 30 стр., можно достать больше?
Вероятнее всего это означает, что гугл проиндексировал только 30 страниц этого сайта.
источник

A

Andrii in Scrapy
Georgiy
Вероятнее всего это означает, что гугл проиндексировал только 30 страниц этого сайта.
Страниц сайта 14000000, но гугл только 31 страницу пагинации дает
источник

E

EFS in Scrapy
Andrii
Нужна помощь-совет: есть в гугла такая штука как site:, вот, кто-может или как можно стянуть все урл отого site: ? Мне показует только 30 стр., можно достать больше?
в теории. на практике нет
источник

S

SoHard 🎄 in Scrapy
Andrii
Страниц сайта 14000000, но гугл только 31 страницу пагинации дает
Посмотри что в robots
источник

A

Andrii in Scrapy
SoHard 🎄
Посмотри что в robots
googla ?
источник

S

SoHard 🎄 in Scrapy
Может там всё закрыто
источник

S

SoHard 🎄 in Scrapy
Andrii
googla ?
Сайта
источник

S

SoHard 🎄 in Scrapy
Там указано куда Гуглу не лазить
источник

A

Andrii in Scrapy
он даже в кеше есть, 200к страниц спарсил
источник

A

Andrii in Scrapy
а вот еще url как набрать, хз
источник

A

Andrii in Scrapy
вот думал через гугл,  у него все урл есть, а как достать - хз
источник

МС

Михаил Синегубов... in Scrapy
Andrii
вот думал через гугл,  у него все урл есть, а как достать - хз
хм, а если через сайтмап вытащить старницы сайта и по ним попробовать кеш достать?
это все теория, я то и кэш гугла не ковырял :)

кстати, если так дохрена страниц - может в вебархиве глянуть?
источник

A

Andrii in Scrapy
Михаил Синегубов
хм, а если через сайтмап вытащить старницы сайта и по ним попробовать кеш достать?
это все теория, я то и кэш гугла не ковырял :)

кстати, если так дохрена страниц - может в вебархиве глянуть?
нет сайтмапа, урл подружает через апи, которая дает не больше 40 страниц пагинации. Короч есть 100 разделов, где максимум можно стануть 80.000 урлов без гемороя. Но на сайте минимум 1.4млн страниц.
источник

A

Andrii in Scrapy
Михаил Синегубов
хм, а если через сайтмап вытащить старницы сайта и по ним попробовать кеш достать?
это все теория, я то и кэш гугла не ковырял :)

кстати, если так дохрена страниц - может в вебархиве глянуть?
ну так тяну,а вот новЬІе урл стянуть очень сложно
источник

МС

Михаил Синегубов... in Scrapy
дай сайт в личку, вдруг что на ум придет...
источник

A

Andrii in Scrapy
источник

Ф

Фара in Scrapy
Andrii
Нужна помощь-совет: есть в гугла такая штука как site:, вот, кто-может или как можно стянуть все урл отого site: ? Мне показует только 30 стр., можно достать больше?
(Точно не могу знать никогда не пробовал )но может в настройках аккаунта попробуйте проставить настройки в отображении минимум 100 сайтов в гугле
источник

Marat Мkhitаrуаn in Scrapy
Где можно хранить счетчик айди?
источник