Обработка текстовой информации

Plan your website and create the next important tasks for get your project rolling

Get Started. It's Free
or sign up with your email address
Rocket clouds
Обработка текстовой информации by Mind Map: Обработка текстовой информации

1. По формуле N=2 I можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак.

1.1. N – количество символов

1.2. K- количество бит на символ

1.3. I- информационный объем текста

1.3.1. N = 2 I => 256 = 2 I => 2 8 = 2 I => I =     8 битов Для кодирования одного символа требуется один байт информации.

2. В настоящее время существуют пять различных кодовых таблиц для русских букв.

2.1. Windows

2.2. MS-DOS

2.3. КОИ -8

2.3.1. КОИ -8

2.4. Mac

2.5. ISO

3. Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам.

3.1. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код.

3.2. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов ( двоичный код знака ).

3.3. Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.

4. При кодировании каждому символу алфавита ставиться в соответствие уникальный двоичный код.

4.1. Таблица кодировки – это таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера ( коды ).

4.1.1. от 0 до 32 соответствуют операциям ( перевод строки, ввод пробела и т. д.)

4.1.2. от 33 по 127 соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания ;

4.1.3. от 128 по 255 в различных национальных кодировках одному и тому же коду соответствуют разные знаки.

5. Текст - это любая последовательность символов.

5.1. Компьютерный алфавит включает в себя 256 символов.

5.2. Текстовым документом называется файл, созданный с помощью текстового редактора.

5.3. Текстовая информация – это информация, выраженная с помощью естественных и формальных языков в письменной форме.

5.4. Текстовая информация – прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы.

6. Виды текстов:

6.1. Гипертекст – это текст, содержащий в себе смысловые связи с другими текстами , графической, видео- или звуковой информацией.Переход осуществляется по гиперссылке, которая представляет собой цветной подчеркнутый текст или графику.

6.2. Абзац – это последовательность строк, сгруппированных по смысловому содержанию.

7. Для разных типов ЭВМ используются различные таблицы кодировки.

7.1. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standard Code for Information Interchange) - американский стандартный код для информационного обмена.

7.1.1. В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов )

7.1.2. По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту : N = 2 I = 2 16 = 65 536. Такого количества символов достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

8. Единицами текстовой информации являются.

8.1. Символ – наименьшая единица символьной информации

8.2. Слово – набор символов, ограниченный пробелами

8.3. Абзац – группа смежных строк файла, первая из которых может начинаться отступом влево по отношению к другим строкам абзаца, нулевым отступом или отступом вправо

8.4. Строка – произвольная последовательность символов между левой и правой границами абзаца

9. Текстовый процессор – программные средства для создания и обработки текстов

9.1. В отличие от текстовых редакторов позволяют вставлять в документ таблицы, рисунки, схемы

9.1.1. Самый распространенный MS Word