Можно ли получить тип файла веб-страницы.
Иногда я вижу такие страницы:
random.com/game
Какой тип файла игры?
Конечно, я могу попытаться угадать типы файлов, такие как game.html, game.php и т. Д., Но есть ли способ получить его?
Нет, это невозможно. На это есть несколько причин:
/game
может быть подкаталогом. В этом случае файл может быть одной из любых индексных страниц по умолчанию для веб-сервера, обслуживающего страницу.
/game
может быть настроен через маршрутизацию сервера, чтобы указать куда-то совершенно другое на сайте.
/game
может быть маршрутом в веб-приложении. В этом случае нет единого файла для страницы. Сервер может направить запрос к коду приложения, который использует любое количество файлов для построения страницы.
Вы можете прочитать, как сервер обслуживает содержимое (тип MIME), просмотрев заголовки HTTP, но фактический тип файла не может быть точно определен с удаленного хоста через HTTP / HTTPS.
Например, вот ответ на успешный запрос веб-страницы:
HTTP/1.1 200 OK
Date: Mon, 08 Dec 2014 21:50:36 GMT
Server: Apache/2.2.27 (FreeBSD) PHP/5.5.11 mod_ssl/2.2.27 OpenSSL/0.9.8y DAV/2
Content-Length: 311
Connection: close
Content-Type: text/html; charset=iso-8859-1
Итак, сервер говоря Вы считаете, что страница является text / html … но она может быть сгенерирована любым количеством серверных технологий (PHP, Java, Python и т. д.).