Кто-нибудь предложит мне идею скопировать данные из файла PDF и сохранить их в базе данных MySql с помощью PHP или любого другого инструмента.
На самом деле, я создаю сценарий, который будет читать содержимое в виде простого текста (преобразование содержимого PDF в обычный текст с помощью инструмента apache-tika) и сохранять его в базе данных. Но это очень длительный и не точный процесс.
Поэтому, пожалуйста, предложите мне любой другой подход для выполнения этой задачи.
Вы можете сделать одну вещь: если вы хотите удалить 1 или 2 PDF, вы можете конвертировать PDF в HTML, используя любой онлайн-инструмент, а затем с помощью библиотеки simplehtmlDom вы можете удалить данные.
ты можешь использовать PDF Text Extractor вытащить текст из pdf.
я надеюсь, что это поможет вам
Других решений пока нет …