Проблема с & quot; URL-адресами должна включать & quot; с поисковой системой Sphider

я использую Sphider.

Я хочу разрешить Spider покинуть мой домен http://www.example.com но только URL-адреса сканирования / посещения, содержащие example, Означает только URL, как http://www.example.com или же http://www.my-example.com или же http://www.test.example.com должен быть посещен / проиндексирован, но НЕ http://www.exa-mple.com.

После прочтения руководство Я попробовал следующее: Скриншот того, что я пробовал.

Но я получаю это сообщение при попытке индексации: Изображение: что я получаю, когда пытаюсь проиндексировать.

Кто может мне помочь. Что я делаю неправильно? Я тоже уже пробовал *example* но это тоже не сработало.

2

Решение

документация содержит вводящий в заблуждение пример:

Каждая строка начинается с '*' перед рассматривается как регулярное выражение, так что '*/[a]+/' обозначает строку с одним или несколькими буквами.

[...] это класс персонажа который соответствует любому отдельному символу из набора / диапазона, определенного внутри него.

Вы можете использовать */example/ определить регулярное выражение, которое соответствует example строка.
Однако, если вы не заинтересованы в проверке контекста, вы можете также использовать example Строка в списке обязательных включений.

2

Другие решения

^(?=.*example)https?:\/\/\S+$

Вы можете попробовать это.
демо-тест здесь https://regex101.com/r/LUkHsD/3

0

По вопросам рекламы [email protected]