Просмотр содержимого документа
«Алфавитный подход к измерению информации»
Алфавитный подход к измерению информации
Автор:
Игнатьева Лариса Николаевна,
учитель информатики
Средней общеобразовательной школы № 24 города Костромы
Достаточно ли места на носителе, чтобы разместить нужную нам информацию?
Сколько времени потребуется, чтобы передать информацию по имеющемуся каналу связи?
Величина, которая нас в этих случаях интересует, называется объемом информации.
Алфавитный (объёмный) подход к измерению информации
Применяется в цифровых (компьютерных) системах) хранения и передачи информации
Для определения количества информации имеет значение лишь размер (объём) хранимого и передаваемого кода
2i=N
i –информационный «вес» символа
N –мощность алфавита (количество символов в алфавите)
i=2
00
i=3
01
000
10
001
11
010
011
100
101
110
111
Английский алфавит: 26 букв + знаки препинания=32 символа
32=2 5
Все символы можно закодировать пятиразрядными двоичными кодами от 00000 до 11111
В двоичном коде каждая двоичная цифра несет одну единицу информации, которая называется 1 бит
Бит является основной единицей измерения информации
Длина двоичного кода, с помощью которого кодируется символ алфавита, называется информационным весом символа
Информационный вес символа в английском алфавите равен 5 битам
Информационный объём текста
складывается из информационных весов всех составляющих текст символов
Английский текст из 1000 символов в телеграфном сообщении будет иметь информационный объём 5000 битов
Информационный объём текста
Алфавит русского языка: 33 буквы + знаки препинания = 39 символов
для двоичного кодирования символов 5-разрядного кода недостаточно, нужен 6-разрядный код
2 6 =64, остается резерв для 25 символов
Информационный вес символа в расширенном русском алфавите равен 6 битам
Текст из 1000 символов будет иметь объём 6000 битов
Информационный объём текста
I=K*i(битов)
I- информационный объём текста
i- информационный объём символа алфавита
К – количество символов в тексте
Количество информации, содержащееся в тексте, определяется
минимально возможной длиной двоичного кода, необходимого для представления этого текста
Андрей Николаевич Колмогоров
(1903-1987)
Ряд целых степеней двойки
i
1
2 i
2
2
3
4
4
8
5
16
6
32
7
34
8
128
9
256
10
512
1024
Пример. Определить информационный вес символа алфавита, включающего в себя все строчные и прописные русские буквы (66), цифры (10), знаки препинания, скобки, кавычки (10). Всего 86 символов
2 6
i=7 битов
Двоичное представление текстов в компьютере
Используется восьмиразрядный код
2 8 =256
Кодовая таблицаANSI
Единицы измерения информации
1байт = 8 битов
Информационный объём текста в памяти компьютера измеряется в байтах. Он равен количеству символов в записи текста
Единицы измерения информации
1 Кб (килобайт) = 2 10 байтов = 1024 байта
1 Мб (мегабайт) = 2 10 Кб = 1024 Кб
1 Гб (гигабайт) = 2 10 Мб = 1024 Мб
1 Тб (терабайт) = 2 10 Гб = 1024 Гб
В компьютере любые виды информации: тексты, числа, изображения, звуки – представляются в форме двоичного кода
Объём информации любого вида, выраженный в битах, равен длине двоичного кода, в котором эта информация представлена
Используемые источники
Семакин И. Г. Информатика. Базовый уровень: учебник для 10 класса/И. Г. Семакин, Е. К. Хеннер, Т. Ю. Шеина. – М. БИНОМ, Лаборатория знаний, 2015 - https://drive.google.com/file/d/0B6696ckkWj_zUHllZHhTdW1wZ1U/view