Есть спам-сайт, который является точной копией моего сайта. Они непрерывно сканируют мой сайт и буквально обновляют / добавляют контент в течение 20 минут (буквально все 30 тыс. + URL). После некоторых исследований я уверен, что они сканируют мой сайт и хранят его на своем сервере.
Они используют CloudFlare, поэтому я не могу знать их истинный IP-адрес. Могу ли я как-то заблокировать их сканирование моего сайта (VIA .htaccess или чего-то еще), просто зная доменное имя?
Вполне возможно, что сервер, с которого запускается сценарий сканирования, полностью отделен от сервера, на котором размещен клон, даже если они не использовали Cloud Flare.
Однако, если они сканируют весь этот контент, это должно быть довольно очевидно в журналах доступа вашего сервера. Если вы не знаете, где они находятся, поговорите с вашим хостинг-провайдером. Затем найдите наиболее распространенные IP-адреса в списке и попробуйте заблокировать их следующим образом:
Order Allow,Deny
Allow from All
Deny from x.x.x.x
Других решений пока нет …