сканер сайтов typo3 не индексируется

Я пытаюсь получить страницу, проиндексированную с индексированным поиском и поиском по сайту на старом веб-сайте TYPO3 4.5 — но я попробовал почти все безрезультатно.

Я запускаю сканер сайта, и он получит полный список URL-адресов, которые можно сканировать, и я запускаю всю очередь

введите описание изображения здесь

Я настроил «Конфигурацию индекса»

введите описание изображения здесь

и сканер сайта

введите описание изображения здесь

Но это не будет индексировать

введите описание изображения здесь

таблица «cache_pages» также кажется пустой — но кэширование включено для всех страниц.

Чего мне не хватать?

3

Решение

Скриншот, показывающий очередь на гусеничном ходу, выглядит хорошо. Кажется, сканер настроен правильно, но индексированный поиск не индексирует страницы.
Пустой кеш страницы говорит о том, что у вас отключен кеш шоу.

Индексированный поиск индексирует страницы при выполнении нескольких условий:

  1. страница кэшируется (нет page.config.no_cache = 1 в TypoScript кеш не отключается в свойствах страницы и кеш не отключается из кода PHP)
  2. в исходном коде есть специальные маркеры <!--TYPO3SEARCH_begin--> а также <!-- TYPO3SEARCH_end-->
  3. TypoScript page.config.index_enable = 1 установлено
  4. К странице обращаются пользователи, не вошедшие в Backend или Crawler

Что вы можете проверить это:

  • Пожалуйста, проверьте в TypoScript Object Browser, имеют ли значения index_enable и no_cache правильные значения для неиндексированных страниц.
  • Включите режим отладки в Extension Manager для поиска и индексированного поиска
  • Нажмите на номер в столбце «id очереди» для неиндексированной страницы и проверьте показанные там данные.
  • Перед началом индексации дважды проверьте, не заполнено ли поле «идентификатор сеанса» в индексированной записи конфигурации поиска.
  • Удалить дату из поля «Следующая дата индексации» из индексированной записи конфигурации поиска

Несколько полезных ссылок:

2

Другие решения

Если ни одно из предложений Tymoteusz не сработало, проверьте, работает ли ваш сайт в режиме https, с подписанным сертификатом (например, если вы разрабатываете на своем локальном компьютере). Если это так, просто запустите свой веб-сайт без https и повторите проверку сканера. Я недавно протестировал веб-сайт TYPO3 6.2 с правильно настроенными сканером и indexed_search, и страницы никогда не индексировались. Ошибка, которую я получил в crawlerlog, была пустым сообщением об ошибке, и в базе данных таблица tx_crawler_queue показала значение b: 0; в столбце «result_data».
Как только я перешел на http все работало просто отлично.

В производственном процессе он должен нормально работать с использованием https, если вы используете действующий сертификат.

0

По вопросам рекламы [email protected]