Я пытаюсь скрести https://www.gst.gov.in
echo $html = file_get_contents("https://www.gst.gov.in");
Этот код прекрасно работает на локальном хосте, но не на сервере.
Я пробовал использовать разные подачи с различными методами curl с пользовательскими заголовками и ссылками, но не повезло. На сервере появляется ошибка тайм-аута соединения.
Если я использую любой другой https URL или другой сайт, он работает нормально. проблема с этим конкретным URL может кто-нибудь помочь в очистке этой страницы также, если кто-то может сказать, блокирует ли удаленный сервер запрос, то как обойти это.
Это правительственный веб-сайт — он, скорее всего, блокирует любые IP-адреса из географического региона, который не является локальным.
т. е. ваш сервер должен находиться в Индии или иметь индийский прокси, поскольку вы пытаетесь загрузить страницу правительства Индии.
Других решений пока нет …