Size: a a a

2020 January 25

Vs

Vladislav support.od.ua in nginx_ru
выставите правильный UA по вкусу
источник

J

JS in nginx_ru
map $http_user_agent $access_bots {
    default '';
     ~(YandexBot|www\.google\.com\/bot) access;
}
location ~* \.(xml)$ {
  # return 403 $access_bots;
    if ($access_bots = '' ) { return 404; }
     try_files $uri =404;
}
в общем получилось так
источник

MD

M Dan in nginx_ru
А для чего вообще это нужно, практическое применение
источник

J

JS in nginx_ru
M Dan
А для чего вообще это нужно, практическое применение
Если кто то захочет тебя спарсить, он не получит сразу список всех страниц сайта
источник

J

JS in nginx_ru
С этой ерундой спать легче😂
источник

MD

M Dan in nginx_ru
Понял. Но UA кажется подменить вообще на изи, плюс скорее всего инструменты парсинга это уже умеют из коробки
источник

MD

M Dan in nginx_ru
тебе бы какой-нибудь рейтлимит и одновременный алярм
источник
2020 January 26

J

JS in nginx_ru
M Dan
тебе бы какой-нибудь рейтлимит и одновременный алярм
Согласен, но это только часть предпринятых действий.
источник

k

kiosaku in nginx_ru
пусть парсят, жалко чтоль? или нагрузку не держишь?
источник

J

JS in nginx_ru
жалко, контент - это самое ценное что у нас сегодня есть)
источник

АБ

Андрій Бакай in nginx_ru
M Dan
Понял. Но UA кажется подменить вообще на изи, плюс скорее всего инструменты парсинга это уже умеют из коробки
это даже не инструменты парсинга, а самый обычный хром может делать
источник

АБ

Андрій Бакай in nginx_ru
а простый реквесты и подавно
источник

АБ

Андрій Бакай in nginx_ru
всего-то кастомный хедер отдать
источник

АБ

Андрій Бакай in nginx_ru
JS
Если кто то захочет тебя спарсить, он не получит сразу список всех страниц сайта
и тогда ещё проверяйте, не отсутствует ли юзер-агент вообще,
+ проверьте дефолтные юа самых популярных модулей
источник

АБ

Андрій Бакай in nginx_ru
вот лично мне, если надо что-то спарсить, проще всего сначала заюзать обычный реквест, а если не прокатило, то тот же обычный реквест, но с хедерами, как в хроме
источник

J

JS in nginx_ru
Да, я тоже так делаю
источник

АБ

Андрій Бакай in nginx_ru
если и это не помогло, то всё больше имитации пользователся вплоть до использования хрома с дев-тулсом
источник

АБ

Андрій Бакай in nginx_ru
но там уже ток капча в помощь
источник

J

JS in nginx_ru
Вопрос не в том как совсем пресечь парсинг, это не возможно.
Я про усложнение жизни таким ботам, людям.
Есть интересная идея блокировать более нескольких соединений с одного ip.
Но главное не затронуть пс. По юзер агенту можно было бы , но это не серьезно. Надо вычислить пс по ip. И тут вопрос как это сделать. При том что иногда ip меняются или добавляются
источник

АБ

Андрій Бакай in nginx_ru
JS
Вопрос не в том как совсем пресечь парсинг, это не возможно.
Я про усложнение жизни таким ботам, людям.
Есть интересная идея блокировать более нескольких соединений с одного ip.
Но главное не затронуть пс. По юзер агенту можно было бы , но это не серьезно. Надо вычислить пс по ip. И тут вопрос как это сделать. При том что иногда ip меняются или добавляются
кому надо - заюзают пул прокси, а обычным людям могут баги вылезть с запретами
источник