Просмотр содержимого документа
«Конспект урока : "Алфавитный подход к измерению информации" »
Урок 7( 1 урок).
Тема: Алфавитный подход к измерению информации
Цель: сформировать у учащихся понимание алфавитного подхода к измерению информации. Требования к знаниям и умениям:
Учащиеся должны знать:
что такое «алфавит», «мощность алфавита», «скорость передачи данных»;
производные единицы измерения информации;
как найти количество информации в тексте.
Учащиеся должны уметь:
находить количество информации в тексте;
переводить количество информации в производные. Программно-дидактическое обеспечение: ПК, программа Калькулятор.
Ход урока
I. Постановка целей урока
Сколько символов в компьютерном алфавите?
Каков объем информации, содержащейся в книге, на аудиокассете, на компакт-диске, в библиотеке?
Для передачи информации в объеме 10 учебников можно затратить всего 1 минуту. Как это сделать?
II. Проверка домашнего задания
Задачи уровня знания и понимания проверьте на доске. Работа над ошибками в практической работе.
III. Изложение нового материала
1. Алфавитный подход к измерению информации
Вы научились определять количество информации, которое содержится в сообщениях, уменьшающих неопределенность наших знаний, т. е. мы рассматривали информацию со своей точки зрения — с позиции человека. Для нас количество информации зависит от ее содержания, понятности и новизны. Например, в опыте по доставанию шара из корзины одинаковое количество информации содержится и в зрительном образе (мы видим красный шар), и во фразе «Красный шар», и в длинной фразе «Я достал красный шар».
Однако любое техническое устройство не воспринимает содержание информации. Здесь не работают «неопределенность знаний» и «вероятность информации». Поэтому в вычислительной технике используется другой подход к измерению информации.
Вокруг нас везде и всюду происходят информационные обмены. Информацией обмениваются между собой люди, животные, технические устройства, органы человека или животного и т.д. во всех этих случаях передача информации происходит в виде последовательностей различных сигналов. В вычислительной технике такие сигналы кодируют определенные смысловые символы, т.е. такие сигналы кодируют последовательности знаков -букв, цифр, кодов цвета точек и т.д. С этой точки зрения рассматривается другой подход к измерению информации — алфавитный.
Каким образом в этом случае можно найти количество информации?
Рассмотрим пример:
У нас есть небольшой текст, написанный на русском языке. Он состоит из букв русского алфавита, цифр, знаков препинания. Для простоты будем считать, что символы в тексте присутствуют с одинаковой вероятностью.
Множество используемых в тексте символов называется алфавитом. В информатике под алфавитом понимают не только буквы, но и цифры, и знаки препинания, и другие специальные знаки. У алфавита есть размер (полное количество его символов), который называется мощностью алфавита.
Обозначим мощность алфавита через N. Тогда воспользуемся формулой для нахождения количества информации их вероятностного подхода:
I = log2N.
Для расчета количества информации по этой формуле нам необходимо найти мощность алфавита N. На самом деле мы уже рассчитывали мощность алфавита, когда рассматривали кодирование текстовой информации. Найдем N для нашей задачи.
Пример 1
Найти объем информации, содержащейся в тексте из 3000 символов, написанном русскими буквами.
Решение:
1) Найдем мощность алфавита:
N = 33 русских прописных буквы + 33 русских строчных букв + 21 специальный знак = 87 символов.
Подставим в формулу и рассчитаем количество информации:
2) I = log287 = 6,4 бита.
Такое количество информации - информационный объем - несет один символ в русском тексте. Теперь, чтобы найти количество информации во всем тесте, нужно найти общее количество символов в нем и умножить на информационный объем одного символа.
Пусть в тексте 3000 символов. Значит
6,4*3000= 19140 бит.
Теперь дадим задание переводчику перевести этот текст на немецкий язык. Причем так, чтобы в тексте осталось 3000 символов. Содержание текста при этом осталось точно такое же. Поэтому с точки зрения вероятностного подхода количество информации также не изменится, т.е. новых и понятных знаний не прибавилось и не убавилось.
Пример 2
Найти количество информации, содержащейся в немецком тексте с таким же количеством символов.
Решение:
Найдем мощность немецкого алфавита:
1) N = 26 немецких прописных буквы + 26 немецких строчных букв + 21 специальный знак = 73 символа.
Найдем информационный объем одного символа:
2)I = log273 = 6,1 бит.
Найдем объем всего текста.
3)6,1*3000= 18300 бит.
Сравнивая объемы информации русского текста и немецкого, мы видим, что на немецком языке информации меньше, чем на русском. Но ведь содержание не изменилось! Следовательно, при алфавитном подходе к измерению информации ее количество не зависит от содержания, а зависит от мощности алфавита и количества символов в тексте. С точки зрения алфавитного подхода, в толстой книге информации больше, чем в тонкой. При этом содержание книги не учитывается.
Правило для измерения информации с точки зрения алфавитного подхода.
Найти мощность алфавита — N.
Найти информационный объем одного символа - i = log2N.
Найти количество символов в сообщении — К.
4. Найти информационный объем всего сообщения — I. Пример 3
Найти объем текста, записанного на языке, алфавит которого содержит 128 символов и 2000 символов в сообщении.
Дано: К = 2000, N= 128.
Найти: I — ?
Решение:
1) i = log2N = log2128 = 7 бит - объем одного символа.
В компьютере также используется свой алфавит, который можно назвать компьютерным. Количество символов, которое в него входит, равно 256 символов. Это мощность компьютерного алфавита. Также мы выяснили, что закодировать 256 разных символом можно с помощью 8 бит. 8 бит является настолько характерной величиной, что ей присвоили свое название - байт.
Итак, следующая по величине единица измерения информации - байт.
1 байт = 8 битам.
Используя этот факт можно быстро подсчитать количество информации, содержащееся в компьютерном тексте, т.е. тексте, набранном с помощью компьютера. А учитывая, что большинство статей, книг, публикаций и т.д. написаны с помощью текстовых редакторов, то таким способом можно найти информационный объем любого сообщения, созданного подобным образом. Пример 4
Найти информационный объем страницы компьютерного текста.
Пояснение: возьмите в качестве примера реальный текст из какого-нибудь учебника без картинок. Расчеты производить приблизительно.
Решение:
Найдем информационный объем одного символа: I = log2N, N = 256, I = log2256 = 8 бит = 1 байт.
Найдем количество символов на странице. Примерно.
— Как можно это сделать быстро? (Найти количество символов в строке и умножить на количество строк.)
Пояснение: пусть дети выберут произвольную строку и подсчитают количество символов в ней, учитывая все знаки препинания и пробелы. Упростите до целого значения. 40 символов *50 строк = 2000 символов.
Вывод: дело в том, что информационный объем одного символа несет как раз 1 байт информации. Поэтому достаточно подсчитать количество символов в тексте, которое и даст объем текста в байтах.
Например, если в тексте 3000 символов, то его информационный объем равен 3000 байтам.
Согласитесь, что байт - маленькая единица измерения информации.
Пример 5
Найти информационный объем небольшой книги в 130 страниц.
Пояснение: страницы взять из предыдущей задачи.
Решение:
2000 байт • 130 = 260000 байт.
Ответ: 260000 байт.
И это информационный объем только одной книги! А если взять объем целой библиотеки? Получится очень большое число.
Для измерения больших объемов информации используют следующие единицы:
1 килобайт = 1 Кб = 210 байт = 1024 байта;
1 мегабайт = 1 Мб = 210Кб = 1024 Кб;
1 гигабайт = 1 Гб = 210Мб = 1024 Мб.
В 100 Мб можно уместить:
Страниц текста
50 000
Цветных слайдов высочайшего качества
150
Аудиозапись
1,5 часа
Музыкальный фрагмент качества CD — стерео
10 минут
фильм высокого качества записи
15 секунд
Протоколы операций по банковским счетам
За 1000 лет
Обмен информацией происходит с разной скоростью. Если говорить о людях, то темп речи очень важен для взаимопонимания. Некоторые люди разговаривают очень медленно, другие — наоборот быстро (тараторят). И с теми и с другими иногда слушателю бывает некомфортно. Скорость чтения также у людей бывает разная. Конечно, хорошо обладать высокой скоростью чтения, больше книг можно прочитать. Существуют даже специальные приемы развития высокой скорости чтения. Скорость передачи информации называется скоростью информационного потока и выражается в битах в секунду (бит/с), байтов в секунду (байт/с), Кбайтов в секунду (Кб/с) и т.д.
Скорость чтения и скорость речи можно вычислить.
Скорость информационного потока в случае, когда он происходит между техническими устройствами, намного выше, чем между людьми. Прием и передачи информации в этом случае происходит по каналам связи. К основным характеристикам каналов связи относятся:
максимальная скорость передачи информации по каналу связи называется пропускной способностью канала;
надежность;
стоимость;
резервы развития.
В следующей таблице приведены характеристики некоторых каналов связи.
Пояснение: таблицу подготовьте заранее на доске или на бумаге и раздайте Детям.
Анализируя эту таблицу, можно сказать, что сегодня предпочтение отдается высокоскоростному оптоволокну. Информация по таким каналам связи передается в виде светового сигнала, посылаемого лазерным излучателем. Например, при скорости 50 Мбайт/с в течение 1 минуты передается объем информации, равный содержанию 10 школьных учебников.
IV. Закрепление изученного
Ответьте на вопросы, поставленные в начале урока.
Решите задачи:
№2.
Перевести объем книги из примера 5 в другие единицы измерения. Решение: