Наша страница PHP была просто страницей UTF-8, состоящей из китайских символов в мета-описаниях.
Я не знаю, почему, когда кто-то пытался поделиться ссылками на WhatsApp, он показывал битые буквы.
Но я поделился этим, чтобы найти его неразрушенным (нормальным).
Каковы возможные причины этого? Мы добавили оба:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
а также
header('Content-Type: text/html; charset=UTF-8');
У кого-нибудь есть подсказка? Спасибо!
==========
Используемое программное обеспечение (скажем, программное обеспечение для ведения блогов) плохо обрабатывает контент в кодировке UTF-8, что приводит к выводу в браузер не-UTF8.
Дело не в том, что программное обеспечение для ведения блогов будет иметь недостатки во всех операциях с контентом, скорее наоборот: оно имеет недостатки только в некоторых операциях с контентом. Но это происходит на каждой странице, которую я видел, и этого достаточно, чтобы простая проверка UTF-8 потерпеть поражение:
$ curl -s 'http://entrepreneur-times.com/l/tch/blog/?id=12' \
| php -r 'var_dump(preg_match("~~u", file_get_contents("php://stdin")));'
bool(false)
Проблема заключается в создании текстов описания (метатеги HTML для описания и og: description). Эта часть программного обеспечения не учитывает кодировку контента Unicode UTF-8 и просто отключается в некоторой двоичной длине (скорее всего, я не видел код). Такой способ резки нарушает производительность UTF-8.
Исправление здесь, чтобы удалить недостаток программного обеспечения.
Других решений пока нет …