Я пытаюсь взять весь сайт в объект DOM, как это:
$dom = new DOMDocument('1.0');
$dom->loadHTMLFile('http://thissite.com');
так что я могу манипулировать им и сохранить шаблон.
Однако некоторые объекты (теги, которые я заметил) удаляют пользовательские атрибуты, так что:
<a href="/link/to/page/" aria-haspopup="true">Link Name</a>
изменения в:
<a href="/link/to/page/">Link Name</a>
Есть ли способ остановить это?
ОБНОВЛЕНИЕ: Похоже, что это не проблема, оставлю ответ ниже, чтобы объяснить и, возможно, помочь другим.
Таким образом, проблема не была пользовательским атрибутом. Этот пользовательский атрибут был вставлен позже через javascript, он просто получал неправильную ссылку на файл javascript.
При поиске неисправностей я искал «элемент проверки», а не источник страницы. Если у вас есть эта проблема, посмотрите на исходный источник страницы (не используя inspect) и посмотрите, отличается ли атрибут (или какое-либо отличие от исходного кода) между кодом в DOMDocument (с помощью echo $ dom-> saveHTML () ;).
Если это то же самое, то DOMDocument не является проблемой, и вам нужно будет проверить ваш javascript (это относительные ссылки) и т. Д.
Других решений пока нет …