С помощью strtok
каждый пункт в параграфе можно получить индивидуально.
Я хочу захватить все предложения на странице индивидуально для обработки их отдельно.
Одним из решений является сохранение цикла и проверка каждого символа, если он .
тогда я считаю, что предложение закончено, поэтому сохраните его в некоторой структуре данных. I dont know which data structure is best suitable to store this
, Массив или вектор?
Есть ли другой лучший способ или какой-нибудь класс C ++ для этого?
ОБНОВИТЬ
Позже я хочу выполнить действие по отрицаниям в предложении. Средства с учетом not
, no
, nope
такие ключевые слова. если not
+ negative word
затем принять это как + ве слово.
Поскольку вы используете C ++, лучшей структурой данных для хранения строк является std::string
учебный класс. Храните несколько строк в std::vector<std::string>
. Кстати не используйте strtok
использовать std::getline
вместо.
Но поскольку вы занимаетесь манипулированием текстом и, возможно, манипулированием текстом на международном уровне, вы должны взглянуть на ICU библиотека. В этом случае icu::BreakIterator::createSentenceInstance
особенно.
Других решений пока нет …