Обработка текстовой информации

Plan your website and create the next important tasks for get your project rolling

Начать. Это бесплатно
или регистрация c помощью Вашего email-адреса
Обработка текстовой информации создатель Mind Map: Обработка текстовой информации

1. По формуле N=2 I можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак.

1.1. N – количество символов

1.2. K- количество бит на символ

1.3. I- информационный объем текста

1.3.1. N = 2 I => 256 = 2 I => 2 8 = 2 I => I =     8 битов Для кодирования одного символа требуется один байт информации.

2. Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам.

2.1. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код.

2.2. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов ( двоичный код знака ).

2.3. Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.

3. В настоящее время существуют пять различных кодовых таблиц для русских букв.

3.1. Windows

3.2. MS-DOS

3.3. КОИ -8

3.3.1. КОИ -8

3.4. Mac

3.5. ISO

4. Для разных типов ЭВМ используются различные таблицы кодировки.

4.1. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standard Code for Information Interchange) - американский стандартный код для информационного обмена.

4.1.1. В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов )

4.1.2. По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту : N = 2 I = 2 16 = 65 536. Такого количества символов достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

5. Текстовый процессор – программные средства для создания и обработки текстов

5.1. В отличие от текстовых редакторов позволяют вставлять в документ таблицы, рисунки, схемы

5.1.1. Самый распространенный MS Word

6. Текст - это любая последовательность символов.

6.1. Компьютерный алфавит включает в себя 256 символов.

6.2. Текстовым документом называется файл, созданный с помощью текстового редактора.

6.3. Текстовая информация – это информация, выраженная с помощью естественных и формальных языков в письменной форме.

6.4. Текстовая информация – прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы.

7. Виды текстов:

7.1. Гипертекст – это текст, содержащий в себе смысловые связи с другими текстами , графической, видео- или звуковой информацией.Переход осуществляется по гиперссылке, которая представляет собой цветной подчеркнутый текст или графику.

7.2. Абзац – это последовательность строк, сгруппированных по смысловому содержанию.

8. При кодировании каждому символу алфавита ставиться в соответствие уникальный двоичный код.

8.1. Таблица кодировки – это таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера ( коды ).

8.1.1. от 0 до 32 соответствуют операциям ( перевод строки, ввод пробела и т. д.)

8.1.2. от 33 по 127 соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания ;

8.1.3. от 128 по 255 в различных национальных кодировках одному и тому же коду соответствуют разные знаки.

9. Единицами текстовой информации являются.

9.1. Символ – наименьшая единица символьной информации

9.2. Слово – набор символов, ограниченный пробелами

9.3. Абзац – группа смежных строк файла, первая из которых может начинаться отступом влево по отношению к другим строкам абзаца, нулевым отступом или отступом вправо

9.4. Строка – произвольная последовательность символов между левой и правой границами абзаца