Меня интересует кодировка извлеченного текста с использованием IFilter
,
IFilter::GetText()
извлекает WCHAR*
, но что если файл закодирован с помощью ASCII? А как насчет другой кодировки Unicode (например, UTF-8 или UTF-16?)?
На мой взгляд, это либо IFilter, который позаботился о преобразовании извлеченного текста в одну кодировку (если это так — что это за кодировка?), А если нет, то как узнать, какая это кодировка?
Выходной текст — UTF-16 (все, что в Windows использует WCHAR
это UTF-16). Нет способа запросить кодировку входных данных, вам придется анализировать эти данные самостоятельно, если это необходимо.