
1. По формуле N=2 I можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак.
1.1. N – количество символов
1.2. K- количество бит на символ
1.3. I- информационный объем текста
1.3.1. N = 2 I => 256 = 2 I => 2 8 = 2 I => I = 8 битов Для кодирования одного символа требуется один байт информации.
2. В настоящее время существуют пять различных кодовых таблиц для русских букв.
2.1. Windows
2.2. MS-DOS
2.3. КОИ -8
2.3.1. КОИ -8
2.4. Mac
2.5. ISO
3. Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам.
3.1. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код.
3.2. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов ( двоичный код знака ).
3.3. Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.
4. При кодировании каждому символу алфавита ставиться в соответствие уникальный двоичный код.
4.1. Таблица кодировки – это таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера ( коды ).
4.1.1. от 0 до 32 соответствуют операциям ( перевод строки, ввод пробела и т. д.)
4.1.2. от 33 по 127 соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания ;
4.1.3. от 128 по 255 в различных национальных кодировках одному и тому же коду соответствуют разные знаки.
5. Текст - это любая последовательность символов.
5.1. Компьютерный алфавит включает в себя 256 символов.
5.2. Текстовым документом называется файл, созданный с помощью текстового редактора.
5.3. Текстовая информация – это информация, выраженная с помощью естественных и формальных языков в письменной форме.
5.4. Текстовая информация – прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы.
6. Виды текстов:
6.1. Гипертекст – это текст, содержащий в себе смысловые связи с другими текстами , графической, видео- или звуковой информацией.Переход осуществляется по гиперссылке, которая представляет собой цветной подчеркнутый текст или графику.
6.2. Абзац – это последовательность строк, сгруппированных по смысловому содержанию.
7. Для разных типов ЭВМ используются различные таблицы кодировки.
7.1. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standard Code for Information Interchange) - американский стандартный код для информационного обмена.
7.1.1. В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов )
7.1.2. По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту : N = 2 I = 2 16 = 65 536. Такого количества символов достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.
8. Единицами текстовой информации являются.
8.1. Символ – наименьшая единица символьной информации
8.2. Слово – набор символов, ограниченный пробелами
8.3. Абзац – группа смежных строк файла, первая из которых может начинаться отступом влево по отношению к другим строкам абзаца, нулевым отступом или отступом вправо
8.4. Строка – произвольная последовательность символов между левой и правой границами абзаца
9. Текстовый процессор – программные средства для создания и обработки текстов
9.1. В отличие от текстовых редакторов позволяют вставлять в документ таблицы, рисунки, схемы
9.1.1. Самый распространенный MS Word