Какая кодировка текста получена с помощью IFilter?

Меня интересует кодировка извлеченного текста с использованием IFilter,

IFilter::GetText() извлекает WCHAR*, но что если файл закодирован с помощью ASCII? А как насчет другой кодировки Unicode (например, UTF-8 или UTF-16?)?

На мой взгляд, это либо IFilter, который позаботился о преобразовании извлеченного текста в одну кодировку (если это так — что это за кодировка?), А если нет, то как узнать, какая это кодировка?

3

Решение

Выходной текст — UTF-16 (все, что в Windows использует WCHAR это UTF-16). Нет способа запросить кодировку входных данных, вам придется анализировать эти данные самостоятельно, если это необходимо.

2

Другие решения


По вопросам рекламы [email protected]