Я установил Apache TIKA
а также TIKAJAXRS
Я намерен использовать его с PHP (TIKA в качестве службы). Мне нужно извлечь содержимое URL, а затем манипулировать возвращенным содержимым. Чтобы использовать TIKA в качестве услуги, в документации сказано
Можно использовать удаленный файл с TikaJAXRS
сначала загрузив его по URL, а затем отправив в соответствующую службу:
$ curl -s "http://url/to/my.file" | curl -X PUT -T - <<TIKA ADDRESS>>/meta
$ curl -s "http://url/to/my.file" | curl -X PUT -T -<<TIKA ADDRESS>>/tika
Я не могу перевести вышеприведенные утверждения в PHP, используя PHP cURL.
На основе PHP curl учебник, этот вопрос Stackoverflow и Документация по Apache Tika Server, что вы должны делать, это что-то вроде:
// Set where to connect to
$ch = curl_init("http://localhost:9998/meta");
// Request will be a PUT
curl_setopt($ch, CURLOPT_PUT, 1);
// Set the file to send
$file_path_str = "/path/to/my/file.txt";
$fh_res = fopen($file_path_str, 'r');
curl_setopt($ch, CURLOPT_INFILE, $fh_res);
curl_setopt($ch, CURLOPT_INFILESIZE, filesize($file_path_str));
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
// Send the request
$curl_response_res = curl_exec ($ch);
fclose($fh_res);
// Do something with the result
echo "<p>Tika says:</p>";
echo "<pre>" + $curl_response_res + "</pre>";
Других решений пока нет …