domcrawler — PHP crawler Обнаруживает, что ссылка вызывает загрузку файла

Я разрабатываю php crawler, и я могу получить всю ссылку на страницу. я не хочу сохранять ссылку на ссылку для скачивания файла в моей базе данных, например

http://www.example.com/folder1/thefile.exe

http://www.example.com/folder1/download.php?id=1

http://www.example.com/folder1/thefile.zip

http://www.example.com/folder1/thefile.extension

или любое другое расширение.

Это моя действительная функция, и я знаю, что функция is_file () здесь бесполезна.

protected function isValid($url)
{
$isJavascript = strpos(strtolower($url), 'javascript:') !== false; // remove javascript links
$isEmail = strpos(strtolower($url), 'mailto:')!==false; // remove mailto links

if($isEmail || $isJavascript)
return false;


if(is_file($url)){
echo "is file<br>";
return false;
} else echo "is not file<br>";


if (strpos($url, $this->_host) === false
|| $this->isSeen($url)
) {
return false;
}

return true;
}

Теперь мой вопрос: как я могу обнаружить любой URL, который вызывает загрузку файла?

1

Решение

Задача ещё не решена.

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]