Особенности разбиения текста на предложения (opencorpora.org)

Get Started. It's Free
or sign up with your email address
Особенности разбиения текста на предложения (opencorpora.org) by Mind Map: Особенности разбиения текста на предложения (opencorpora.org)

1. Прямая речь

1.1. Отделена от слов автора переводом строки?

1.1.1. Да

1.1.1.1. граница предложения ставится между словами автора и прямой речью

1.1.2. Нет

1.1.2.1. граница предложений не ставится

1.2. Внутри прямой речи ставятся границы предложений

2. Прямая речь и цитаты, оформленные с использованием кавычек

2.1. Разделять ли слова в кавычках от слов вне кавычек на разные предложения?

2.1.1. Являются ли слова в кавычках членами того же предложения, что и слова вне кавычек?

2.1.1.1. Да, члены одного предложения

2.1.1.1.1. между словами в кавычках и словами вне кавычек не нужно ставить границу предложения

2.1.1.2. Нет, это члены разных предложений

2.1.1.2.1. Слова в кавычках находятся внутри предложения? (или "до и после кавычек есть ещё какие-то слова?")

3. Многоточия

3.1. К какому предложению отнести многоточие между предложениями?

3.1.1. Многоточие находится после знака конца предложения?

3.1.1.1. Да

3.1.1.1.1. относим многоточие к следующему предложению

3.1.1.2. Нет

3.1.1.2.1. многоточие относим к предыдущему предложению

4. Списки

4.1. Все маркеры списков нужно сохранить в начале каждого предложения, если они были в исходном тексте

4.2. Элементы списков разделены переводом строки?

4.2.1. Да

4.2.1.1. Каждый пункт списка - отдельное предложение (конец списка - граница предложения). В одном пункте списка может быть несколько предложений.

4.2.2. Нет

4.2.2.1. Все пункты списка содержатся внутри одного предложения

5. Заголовки

5.1. Заголовок является отдельным абзацем. Это касается и заголовков разделов, глав и т. д. Заголовок может состоять из нескольких предложений.

6. Псевдографика (разделители абзацев, горизонтальные линии и т. д.)

6.1. Вся псевдографика удаляется из исходного текста полностью

7. Ошибки в источнике

7.1. Случайный перевод строки посередине предложения

7.1.1. В случае если автор текста непреднамеренно поставил перевод строки в середине предложения - то в корпусе предложение не разрываем на части

7.2. Пропущенные знаки препинания на конце предложения

7.2.1. Не восстанавливать