Просмотр содержимого документа
«Презентация по информатике "Кодирование. Декодирование информации. Измерение информации. Передача данных".Подготовка к ЕГЭ и ГИА. »
Кодирование.
Декодирование информации.
Измерение информации.
Передача данных.
(задачи для подготовки к ЕГЭ)
Автор: Сергеенкова И.М., учитель информатики.
ГБОУ Школа № 1191
Г. Москва
Сергеенкова ИМ- ГБОУ Школа № 1191
СОДЕРЖАНИЕ:
Максимальное количество слов (последовательностей)
Шифрование. Кодирование
Информационный объем
Передача данных
Источники информации
Сергеенкова ИМ- ГБОУ Школа № 1191
1. Максимальное
количество слов
(последовательностей)
Сергеенкова ИМ- ГБОУ Школа № 1191
Что нужно знать для решения задач:
Кодирование информации в ПК заключается в том, что каждому символу ставится в соответствие уникальный двоичный код.
КОИ-8: 1 символ - 1 байт = 8 бит
UNICODE: 1 символ - 2 байта = 16 бит
Количество информации, которое мы получаем, достигает максимального значения, если события равновероятны. О тношение количества вариантов (или чисел) N к количеству информации которую несет в себе один из вариантов I: N=2I. Полный информационный объем сообщения V равен количеству символов в сообщении K умноженное на количество информации на каждый символ I : V=K*I
Формула Шеннона для равновероятных событий: I=log2N
если алфавит имеет мощность ( количество символов в этом алфавите) М, то количество всех возможных «слов» (символьных цепочек) длиной N (без учета смысла) равно K=M N ; для двоичного кодирования (мощность алфавита M –2 символа) получаем известную формулу: K=2N
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 1.
В алфавите формального языка два знака («0» и «1») и каждое слово этого языка состоит из восьми букв. Определить максимальное количество слов в языке.
Решение.
Существует формула, определяющая максимально возможное количество комбинаций (слов) фиксированной длины определенного алфавита: N = mk
m – это количество символов в алфавите. У нас их два – 0 и 1. Значит m = 2.k – это длина слова, т.е. количество знакомест, отводимых под каждое из них. По условию задачи k = 7.N – максимально возможное количество различных комбинаций из m знаков при длине слова в k знакомест.
В данном случае N = 28 = 256
Ответ. Максимальное количество слов (комбинаций), состоящих из 8-ми букв (знакомест), в алфавите из 2-х знаков равно 256.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 2.
Определить количество различных последовательностей, которые можно закодировать с помощью двоичных слов, состоящих из шести символов (знакомест).
Решение.
Используется та же формула: N = mk
В данном случае m = 2, k = 6 , следовательно,
N = 26 = 64.
Ответ. Максимальное количество последовательностей, которые можно закодировать с помощью двоичных слов, состоящих из восьми букв, равно 64 .
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 3.
Определить количество различных последовательностей из символов “a”, “b”, “c”, “%”, “&” длиной в четыре символа.
Решение.
Используется формула: N = mk
Количество букв (символов) алфавита равно 5, т.е. m = 5 . Длина слова – k = 4 .
Получаем N = 54 = 625
Ответ. Количество последовательностей из пяти любых символов длиной в три символа равно 625.
Сергеенкова ИМ- ГБОУ Школа № 1191
2. Шифрование.
Кодирование
Сергеенкова ИМ- ГБОУ Школа № 1191
Что нужно знать для решения задач:
Кодирование – это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите).
При этом обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием– обратный переход.
Нужно уметь переводить числа из одной СС в другую, особенно из 2-ичной в 8-ричную и 16-тиричную и наоборот.
Существует равномерное и неравномерное кодирование . При равномерном кодировании сообщение декодируется однозначно.
При неравномерном кодировании для однозначного декодирования сообщения нужно, чтобы выполнялось прямое и обратное условие Фано (прямое: никакой код не должен быть началом другого кода, обратное: никакой код не должен быть концом другого кода)
Понимать, что мы можем закодировать сообщение, даже если условие Фано не выполняется, но возможно не сможем его однозначно декодировать.
Однозначно декодировать – получить один единственный точный вариант.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 4.
Для шифрования каждой буквы используются двузначные числа. Известно, что буква «е» закодирована числом20. Среди слов«елка», «полка», «поле», «пока», «кол» есть слова, кодируемые последовательностями цифр11321220, 20121022.
Выясните код слова «колокол».
Сергеенкова ИМ- ГБОУ Школа № 1191
Решение.
Данные последовательности цифр ( 11321220, 20121022 ) состоят из восьми символов.
По условию задачи каждая буква кодируется двумя символами. Значит, эти последовательности кодируют слова, состоящие из четырех букв.
Число 20 кодирует букву «е» . В последовательности 11321220 есть число 20 в конце. Из представленного перечня слов подходит только «поле» .
Отсюда следует, что код «п» - 11, «о» – 32, «л» – 12 .
В последовательности 20121022 есть число 20 в начале. С буквы «е» начинается только слово «елка» .
Следовательно, код «л» - 12 (мы это уже знаем), «к» - 10, «а» - 22 .
Запишем код слова «колокол» - 10|32|12|32|10|32|12.
Ответ. Кодом слова «колокол» является комбинация следующих цифр - 10321232103212.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 5
Для пяти букв алфавита заданы их двоичные коды (для некоторых букв – из двух бит, для некоторых – из трех). Эти коды представлены в таблице:
abcde
0001100100110
Определите, какой набор букв закодирован двоичной строкой
1100000100110.
Сергеенкова ИМ- ГБОУ Школа № 1191
Решение
1 . Ни одна последовательность из двух символов не начинается с 11 , значит первый код 110. Он соответствует букве « b». Будем отбрасывать известную часть кода, оставляя неизвестную - 0000100110 .
2. Ни одна последовательность из двух символов не начинается с 00 , значит следующий код 000 . Это соответствует букве « a ». Остается 0100110 .
3. Следующие два символа – 01 . Если рассматривать три символа, то 010 , однако такая комбинация ничего не кодирует. Следовательно, мы имеем дело с буквой « c ». Остаток – 00110.
4.001 – это «d».
5.10 – это «e».
6. Запишем буквы по порядку:bacde.
Ответ. Двоичной строкой1100000100110закодирован следующий набор букв -bacde.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задача 6.
Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приёмной стороне канала связи. Использовали код:А–1, Б–000, В–001, Г–011. Укажите, каким кодовым словом должна быть закодирована буква Д. Длина этого кодового слова должна быть наименьшей из всех возможных. Код должен удовлетворять свойству однозначного декодирования.
1) 002) 013)114) 010
Решение
Ответ:4) – 010
Сергеенкова ИМ- ГБОУ Школа № 1191
Решение :
Заметим, что для известной части кода выполняется условие Фано – никакое кодовое слово не является началом другого кодового слова
если Д = 00, такая кодовая цепочка совпадает с началом Б = 000 и В = 001, невозможно однозначно раскодировать цепочку 000000: это может быть ДДД или ББ; поэтому первый вариант не подходит
если Д = 01, такая кодовая цепочка совпадает с началом Г = 011, невозможно однозначно раскодировать цепочку 011: это может быть ДА или Г; поэтому второй вариант тоже не подходит
если Д = 11, условие Фано тоже нарушено: кодовое слово А = 1 совпадает с началом кода буквы Д, невозможно однозначно раскодировать цепочку 111: это может быть ДА или ААА; третий вариант не подходит
для четвертого варианта, Д = 010, условие Фано не нарушено;
правильный ответ – 010
Сергеенкова ИМ- ГБОУ Школа № 1191
3. Информационный объем
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 7
Исследователь наблюдает изменение параметра, который может принимать одно из семи значений . Значения записываются при помощи минимального количества бит. Исследователь зафиксировал 120 значений.
Определите информационный объем результатов наблюдения .
Решение:
Ответ.Информационный объем 120 наблюдений , принимаемых семь различных значений , равен45 байтам .
Сергеенкова ИМ- ГБОУ Школа № 1191
Решение. Нам известно максимальное количество значений, которые требуется закодировать с помощью одинаково количества знаков алфавита. Это семь. В качестве алфавита используется бит, который может принимать всего два значения (0 и 1).
Для определения минимального количества бит, необходимых для кодирования одного значения, воспользуемся формулой Хартли: k = log2N . Здесь k – это количество бит, а N – кодируемое количество значений.
В нашем случае: k = log27 . Другими словами, в какую степень нужно возвести двойку, чтобы получить семерку? Мы знаем, что 22 = 4, а 23 = 8 . Следовательно, значение k находится между 2 и 3 и является дробью. Но количество бит не может быть дробным числом. Поэтому в данном случае, для кодирования одного значения требуется 3 бита.
Поскольку исследователь зафиксировал 120 значений, то общий информационный объем наблюдения равен (3 * 120 =) 360 битам или (360 / 8 =) 45 байтам.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 8.
Если каждый символ кодируется двумя байтами, то каков информационный объем следующего предложения в коде Unicode:
Сегодня 35 градусов тепла.
Решение.
Посчитаем общее количество символов в предложении с учетом пробелов, цифр и знаков препинания. В данном случае, всего 26 символов.
Каждый символ кодируется двумя байтами. Значит информационный объем предложения равен (26 * 2 =) 52 байта или (52 * 8) = 416 бита.
Ответ. Информационный объем предложения равен 416 бит.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 9.
Каждое показание датчика, фиксируемое в памяти компьютера, занимает 20 бит . Записано 54 показания датчика.
Каков информационный объем снятых значений в байтах?
Решение.
Информационный объем сообщения в битах равен
(20 * 54 =) 1080 , что в переводе в байты равно (1080 / 8 =) 135.
Канал связи — технические средства, позволяющие осуществлять передачу данных на расстоянии.
Скорость передачи данных - скорость, с которой передается или принимается информация в двоичной форме. Обычно скорость передачи данных измеряется количеством бит, переданных в одну секунду.
Биты в секунду - единица скорости передачи информации, равная количеству двоичных разрядов, пропускаемых каналом связи в 1 секунду с учетом и полезной и служебной информации.
Пропускная способность канала связи - максимальная скорость передачи информации по каналу связи в единицу времени .
Символы в секунду - единица измерения скорости передачи (только) полезной информации.
Сергеенкова ИМ- ГБОУ Школа № 1191
Объем переданной информации V вычисляется по формуле:
V=q⋅t
где q — пропускная способность канала (в битах в секунду или подобных единицах), а t — время передачи.
Обычно пропускная способность измеряется в битах в секунду (бит/с) и кратных единицах Кбит/с и Мбит/с .
Однако иногда в качестве единицы используется байт в секунду ( байт/с ) и кратные ему единицы Кбайт/с и Мбайт/с .
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 10.
Длительность непрерывной передачи данных в сеть Интернет была 12 минут . Определите максимальный размер файла в мегабайтах, который может быть передан за это время, если скорость передачи информации в среднем была 128 килобит/с.
Решение.
12 минут – это 720 (= 12 * 60) секунд.
128 килобит/с – это 128 * 1024 бит/с
Размер файла в битах равен 720 * 128 * 1024
Размер файла в байтах равен (720 * 128 * 1024) / 8 = 90 * 128 * 1024
Размер файла в килобайтах равен (90 * 128 * 1024) / 1024 = 90 * 128
Размер файла в мегабайтах равен 90 * 128 / 1024 = 11,25
Ответ. Размер файла, который можно передать по сети за 12 минут на скорости в 128 килобит/с, составляет 11,25 Мб.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 11.
Сколько времени потребуется сети, работающей со скоростью56000 бит/с , для передачи 30 страниц текста по 50 строк в 70 символов каждая , при условии, что каждый символ кодируется одним байтом.
Решение.
Общее количество символов и размер текста в байтах: 30 * 50 * 70.
В одном байте 8 бит. Следовательно, размер текста в битах: 30 * 50 * 70 * 8
Время находится в результате деления количества бит, которые требуется передать, на скорость сети: (30 * 50 * 70 * 8) / 56 000 = (3 * 5 * 7 * 8) / 56 = 15
Ответ. Для передачи 30 страниц текста по 50 строк, состоящих из 70 символов, со скоростью в 56 000 бит/с потребуется 15 секунд.
Сергеенкова ИМ- ГБОУ Школа № 1191
Задание 12.
Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с , чтобы передать сообщение длиной 225 Кбайт.
Решение.
Выражаем Кбайты в байтах: 225 * 1024.
Выражаем байты в битах: 225 * 1024 * 8 . Именно такое количество бит потребуется передать модему.
Время находится в результате деления количества бит, которые требуется передать, на скорость сети: ( 225 * 1024 * 8) / 14400 = 128
Ответ. Модему потребуется 128 секунд .
Сергеенкова ИМ- ГБОУ Школа № 1191
Задача 13.
Устройство A передает информацию устройству C через устройство B в рамках следующих правил:
1. Информация передается пакетами по 200 байт.2. Устройство B может одновременно принимать информацию от устройства А и передавать ранее полученную информацию устройству C .3. Устройство B может передавать очередной пакет устройству С только после того, как полностью получит этот пакет от устройства A .4. Устройство B обладает неограниченным по объему буфером, в котором может хранить полученные от устройства A , но еще не переданные устройству C пакеты.
Пропускная способность канала между A и B – 100 байт/сек.
Пропускная способность канала между B и C – 50 байт/сек.
Было отправлено два пакета информации.
Через сколько секунд C закончит прием всей информации от A?
Сергеенкова ИМ- ГБОУ Школа № 1191
Решение задачи 13. Так как скорость приема информации устройством B больше, чем скорость ее передачи устройству С, то время передачи сложится из двух этапов.
Продемонстрируем это графически:
Время передачи первого пакета информации от А устройству В равно t 1 = V 1 / q 1 = 200/100 = 2 секунды.
Далее приём информации от А и передача ее устройству С осуществляются устройством В одновременно, поэтому достаточно вычислить время передачи всех трёх пакетов информации от В к С :
t 2 =V 2/ q 2 =600/50=12 секунд.
Общее время передачи: t = t 1 +t 2 = 2 + 12 = 14 секунд.