Обработка текстовой информации

Plan your website and create the next important tasks for get your project rolling

Начать. Это бесплатно
или регистрация c помощью Вашего email-адреса
Rocket clouds
Обработка текстовой информации создатель Mind Map: Обработка текстовой информации

1. По формуле N=2 I можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак.

1.1. N – количество символов

1.2. K- количество бит на символ

1.3. I- информационный объем текста

1.3.1. N = 2 I => 256 = 2 I => 2 8 = 2 I => I =     8 битов Для кодирования одного символа требуется один байт информации.

2. В настоящее время существуют пять различных кодовых таблиц для русских букв.

2.1. Windows

2.2. MS-DOS

2.3. КОИ -8

2.3.1. КОИ -8

2.4. Mac

2.5. ISO

3. Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам.

3.1. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код.

3.2. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов ( двоичный код знака ).

3.3. Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.

4. При кодировании каждому символу алфавита ставиться в соответствие уникальный двоичный код.

4.1. Таблица кодировки – это таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера ( коды ).

4.1.1. от 0 до 32 соответствуют операциям ( перевод строки, ввод пробела и т. д.)

4.1.2. от 33 по 127 соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания ;

4.1.3. от 128 по 255 в различных национальных кодировках одному и тому же коду соответствуют разные знаки.

5. Текст - это любая последовательность символов.

5.1. Компьютерный алфавит включает в себя 256 символов.

5.2. Текстовым документом называется файл, созданный с помощью текстового редактора.

5.3. Текстовая информация – это информация, выраженная с помощью естественных и формальных языков в письменной форме.

5.4. Текстовая информация – прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы.

6. Виды текстов:

6.1. Гипертекст – это текст, содержащий в себе смысловые связи с другими текстами , графической, видео- или звуковой информацией.Переход осуществляется по гиперссылке, которая представляет собой цветной подчеркнутый текст или графику.

6.2. Абзац – это последовательность строк, сгруппированных по смысловому содержанию.

7. Для разных типов ЭВМ используются различные таблицы кодировки.

7.1. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standard Code for Information Interchange) - американский стандартный код для информационного обмена.

7.1.1. В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов )

7.1.2. По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту : N = 2 I = 2 16 = 65 536. Такого количества символов достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

8. Единицами текстовой информации являются.

8.1. Символ – наименьшая единица символьной информации

8.2. Слово – набор символов, ограниченный пробелами

8.3. Абзац – группа смежных строк файла, первая из которых может начинаться отступом влево по отношению к другим строкам абзаца, нулевым отступом или отступом вправо

8.4. Строка – произвольная последовательность символов между левой и правой границами абзаца

9. Текстовый процессор – программные средства для создания и обработки текстов

9.1. В отличие от текстовых редакторов позволяют вставлять в документ таблицы, рисунки, схемы

9.1.1. Самый распространенный MS Word