Какое количество информации содержится в информационном сообщении
Количество информации
Количество информации как мера уменьшения неопределенности знания.
(Содержательный подход к определению количества информации)
Процесс познания окружающего мира приводит к накоплению информации в форме знаний (фактов, научных теорий и т. д.). Получение новой информации приводит к расширению знаний или, как иногда говорят, к уменьшению неопределенности знания. Если некоторое сообщение приводит к уменьшению неопределенности нашего знания, то можно говорить, что такое сообщение содержит информацию.
Например, после сдачи зачета или выполнения контрольной работы вы мучаетесь неопределенностью, вы не знаете, какую оценку получили. Наконец, учитель объявляет результаты, и вы получаете одно из двух информационных сообщений: «зачет» или «незачет», а после контрольной работы одно из четырех информационных сообщений: «2», «3», «4» или «5».
Информационное сообщение об оценке за зачет приводит к уменьшению неопределенности вашего знания в два раза, так как получено одно из двух возможных информационных сообщений. Информационное сообщение об оценке за контрольную работу приводит к уменьшению неопределенности вашего знания в четыре раза, так как получено одно из четырех возможных информационных сообщений.
Ясно, что чем более неопределенна первоначальная ситуация (чем большее количество информационных сообщений возможно), тем больше мы получим новой информации при получении информационного сообщения (тем в большее количество раз уменьшится неопределенность знания).
Количество информации можно рассматривать как меру уменьшения неопределенности знания при получении информационных сообщений.
Рассмотренный выше подход к информации как мере уменьшения неопределенности знания позволяет количественно измерять информацию. Существует формула, которая связывает между собой количество возможных информационных сообщений N и количество информации I, которое несет полученное сообщение:
Бит. Для количественного выражения любой величины необходимо сначала определить единицу измерения. Так, для измерения длины в качестве единицы выбран метр, для измерения массы — килограмм и т. д. Аналогично, для определения количества информации необходимо ввести единицу измерения.
За единицу количества информации принимается такое количество информации, которое содержится в информационном сообщении, уменьшающем неопределенность знания в два раза. Такая единица названа битом.
Если вернуться к рассмотренному выше получению информационного сообщения о результатах зачета, то здесь неопределенность как раз уменьшается в два раза и, следовательно, количество информации, которое несет сообщение, равно 1 биту.
Производные единицы измерения количества информации. Минимальной единицей измерения количества информации является бит, а следующей по величине единицей — байт, причем:
1 байт = 8 битов = 23 битов.
В информатике система образования кратных единиц измерения несколько отличается от принятых в большинстве наук. Традиционные метрические системы единиц, например Международная система единиц СИ, в качестве множителей кратных единиц используют коэффициент 10n, где n = 3, 6, 9 и т. д., что соответствует десятичным приставкам «Кило» (103), «Мега» (106), «Гига» (109) и т. д.
В компьютере информация кодируется с помощью двоичной знаковой системы, и поэтому в кратных единицах измерения количества информации используется коэффициент 2n
Так, кратные байту единицы измерения количества информации вводятся следующим образом:
1 килобайт (Кбайт) = 210 байт = 1024 байт;
1 мегабайт (Мбайт) = 210 Кбайт = 1024 Кбайт;
1 гигабайт (Гбайт) = 210 Мбайт = 1024 Мбайт.
Контрольные вопросы
- 1. Приведите примеры информационных сообщений, которые приводят к уменьшению неопределенности знания.
2. Приведите примеры информационных сообщений, которые несут 1 бит информации.
Определение количества информации
Определение количества информационных сообщений.По формуле (1.1) можно легко определить количество возможных информационных сообщений, если известно количество информации. Например, на экзамене вы берете экзаменационный билет, и учитель сообщает, что зрительное информационное сообщение о его номере несет 5 битов информации. Если вы хотите определить количество экзаменационных билетов, то достаточно определить количество возможных информационных сообщений об их номерах по формуле (1.1):
N = 25 = 32.
Таким образом, количество экзаменационных билетов равно 32.
Определение количества информации. Наоборот, если известно возможное количество информационных сообщений N, то для определения количества информации, которое несет сообщение, необходимо решить уравнение относительно I.
Представьте себе, что вы управляете движением робота и можете задавать направление его движения с помощью информационных сообщений: «север», «северо-восток», «восток», «юго-восток», «юг», «юго-запад», «запад» и «северо-запад» (рис. 1.11). Какое количество информации будет получать робот после каждого сообщения?
Рис. 1.4. Управление роботом с использованием информационных сообщений |
Всего возможных информационных сообщений 8, поэтому формула (1.1) принимает вид уравнения относительно I:
8 = 2I.
Разложим стоящее в левой части уравнения число 8 на сомножители и представим его в степенной форме:
8 = 2 × 2 × 2 = 23.
Наше уравнение:
23 = 2I.
Равенство левой и правой частей уравнения справедливо, если равны показатели степени числа 2. Таким образом, I = 3 бита, т. е. количество информации, которое несет роботу каждое информационное сообщение, равно 3 битам.
Алфавитный подход к определению количества информации
При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Информационная емкость знака. Представим себе, что необходимо передать информационное сообщение по каналу передачи информации от отправителя к получателю. Пусть сообщение кодируется с помощью знаковой системы, алфавит которой состоит из N знаков {1, …, N}. В простейшем случае, когда длина кода сообщения составляет один знак, отправитель может послать одно из N возможных сообщений «1», «2», …, «N», которое будет нести количество информации I (рис. 1.5).
Рис. 1.5. Передача информации |
Формула (1.1) связывает между собой количество возможных информационных сообщений N и количество информации I, которое несет полученное сообщение. Тогда в рассматриваемой ситуации N — это количество знаков в алфавите знаковой системы, а I — количество информации, которое несет каждый знак:
N = 2I.
С помощью этой формулы можно, например, определить количество информации, которое несет знак в двоичной знаковой системе:
N = 2 => 2 = 2I => 21 = 2I => I=1 бит.
Таким образом, в двоичной знаковой системе знак несет 1 бит информации. Интересно, что сама единица измерения количества информации «бит» (bit) получила свое название ОТ английского словосочетания «Binary digiT» — «двоичная цифра».
Информационная емкость знака двоичной знаковой системы составляет 1 бит.
Чем большее количество знаков содержит алфавит знаковой системы, тем большее количество информации несет один знак. В качестве примера определим количество информации, которое несет буква русского алфавита. В русский алфавит входят 33 буквы, однако на практике часто для передачи сообщений используются только 32 буквы (исключается буква «ё»).
С помощью формулы (1.1) определим количество информации, которое несет буква русского алфавита:
N = 32 => 32 = 2I => 25 = 2I => I=5 битов.
Таким образом, буква русского алфавита несет 5 битов информации (при алфавитном подходе к измерению количества информации).
Количество информации, которое несет знак, зависит от вероятности его получения. Если получатель заранее точно знает, какой знак придет, то полученное количество информации будет равно 0. Наоборот, чем менее вероятно получение знака, тем больше его информационная емкость.
В русской письменной речи частота использования букв в тексте различна, так в среднем на 1000 знаков осмысленного текста приходится 200 букв «а» и в сто раз меньшее количество буквы «ф» (всего 2). Таким образом, с точки зрения теории информации, информационная емкость знаков русского алфавита различна (у буквы «а» она наименьшая, а у буквы «ф» — наибольшая).
Количество информации в сообщении. Сообщение состоит из последовательности знаков, каждый из которых несет определенное количество информации.
Если знаки несут одинаковое количество информации, то количество информации Ic в сообщении можно подсчитать, умножив количество информации Iз, которое несет один знак, на длину кода (количество знаков в сообщении) К:
Ic = Iз× K
Так, каждая цифра двоичного компьютерного кода несет информацию в 1 бит. Следовательно, две цифры несут информацию в 2 бита, три цифры — в 3 бита и т. д. Количество информации в битах равно количеству цифр двоичного компьютерного кода (табл. 1.1).
Таблица 1.1. Количество информации, которое несет двоич ный компьютерный код
Двоичный компьютерный код | 1 | 1 | 1 | ||
Количество информации | 1 бит | 1 бит | 1 бит | 1 бит | 1 бит |
- Главная
- Справочник
- Единицы измерений
- Разное
- Вычисление информационного объема сообщения
Информация (лат. informatio — разъяснение, изложение, набор сведений) — базовое понятие в информатике, которому нельзя дать строгого определения, а можно только пояснить:
- информация — это новые факты, новые знания;
- информация — это сведения об объектах и явлениях окружающей среды, которые повышают уровень осведомленности человека;
- информация — это сведения об объектах и явлениях окружающей среды, которые уменьшают степень неопределенности знаний об этих объектах или явлениях при принятии определенных решений.
Основными социально значимыми свойствами информации являются:
- полезность;
- доступность (понятность);
- актуальность;
- полнота;
- достоверность;
- адекватность.
Информационный процесс — это процесс сбора (приема), передачи (обмена), хранения, обработки (преобразования) информации.
Сбор информации — это процесс поиска и отбора необходимых сообщений из разных источников (работа со специальной литературой, справочниками; проведение экспериментов; наблюдения; опрос, анкетирование; поиск в информационно-справочных сетях и системах и т. д.).
Передача информации — это процесс перемещения сообщений от источника к приемнику по каналу передачи. Информация передается в форме сигналов — звуковых, световых, ультразвуковых, электрических, текстовых, графических и др. Каналами передачи могут быть воздушное пространство, электрические и оптоволоконные кабели, отдельные люди, нервные клетки человека и т. д.
Хранение информации — это процесс фиксирования сообщений на материальном носителе. Сейчас для хранения информации используются бумага, деревянные, тканевые, металлические и другие поверхности, кино- и фотопленки, магнитные ленты, магнитные и лазерные диски, флэш-карты и др.
Обработка информации — это процесс получения новых сообщений из имеющихся. Обработка информации является одним из основных способов увеличения ее количества. В результате обработки из сообщения одного вида можно получить сообщения других видов.
Защита информации — это процесс создания условий, которые не допускают случайной потери, повреждения, изменения информации или несанкционированного доступа к ней. Способами защиты информации являются создание ее резервных копий, хранение в защищенном помещении, предоставление пользователям соответствующих прав доступа к информации, шифрование сообщений и др.
Единицы измерения количества информации
Наименьшей единицей информации является бит (англ. binary digit (bit) — двоичная единица информации).
Бит — это количество информации, необходимое для однозначного определения одного из двух равновероятных событий.
Например, один бит информации получает человек, когда он узнает, опаздывает с прибытием нужный ему поезд или нет, был ночью мороз или нет, присутствует на лекции студент или нет и т. д.
В информатике принято рассматривать последовательности длиной 8 битов. Такая последовательность называется байтом.
Производные единицы измерения количества информации:
1 байт = 8 битов
1 килобайт (Кб) = 1024 байта = 210 байтов
1 мегабайт (Мб) = 1024 килобайта = 220 байтов
1 гигабайт (Гб) = 1024 мегабайта = 230 байтов
1 терабайт (Тб) = 1024 гигабайта = 240 байтов
В 1 бит можно записать один двоичный символ.
1 байт = 8 бит
В кодировке ASCII в один байт можно записать один 256 символьный код
В кодировке UNICODE один 256 символьный код занимает в памяти два байта
1 килобайт = 1024 байт
1 мегабайт = 1024 килобайт
1 гигабайт = 1024 мегабайт
1 терабайт = 1024 гигабайт
Чтобы вычислить информационный объем сообщения надо количество символов умножить на число бит, которое требуется для хранения одного символа
Например: двоичный текст 01010111 занимает в памяти 8 бит
Этот же текст в кодировке ASCII занимает 8 байт или 64 бита
Этот же текст в кодировке UNICODE занимает 16 байт или 128 бит.
Не забывайте, что пробелы надо тоже считать за символы поскольку они также набираются на клавиатуре и хранятся в памяти.
Мощность алфавита — это количество символов в алфавите или неопределенность из формулы Хартли.
Информационный вес одного символа — это значение i из формулы Хартли.
Отсюда можно сделать вывод, что не существует алфавита, состоящего из одного символа, поскольку тогда информационный вес этого символа был бы равен 0.
Чтобы перевести биты в байты надо число бит поделить на 8.
Например: 32 бита — это 4 байта.
Чтобы перевести байты в килобайты надо число байтов поделить на 1024.
Например: в 2048 байтах будет 2 килобайта. И так далее по следующим единицам измерения.
Чтобы перевести байты в биты надо число байт умножить на 8.
Например: в 3 байтах будет 24 бита.
Чтобы перевести килобайты в байты надо число килобайт умножить на 1024.
Например: в 3 килобайтах будет 3072 байта и соответственно 24576 бит. И так далее.
Если 128 символьным алфавитом записано сообщение из 5 символов, то объем сообщения — 35 бит.
Мощность алфавита — 128. Это неопределенность. Значит один символ занимает в памяти 7 бит, тогда 5 символов занимают в памяти 35 бит.
Определить, сколько времени будет передавать информацию страницы текста из 40 строк по 80 символов в строке модем, работающий со скоростью 1200 бит/сек.
Вычислим общее количество символов на странице. Это 40 х 80= 3200 символов.
Поскольку в кодировке ASCII один символ занимает в памяти 1 байт, общее количество информации на странице — 3200 байт, но скорость дана в бит/сек. Переведем 3200 байт в биты. Получим 25600 бит.
Разделим 25600 бит на 1200 бит/сек и получим 21,3 сек. Обратите внимание, что здесь нельзя округлить до 21 сек поскольку в этом случае вы не отправите всю заданную информацию.
Однако в случае передачи нескольких страниц текста для приближенного вычисления можно использовать результат 21,3 сек для дальнейших расчетов. Таким образом 10 страниц текста будут переданы за 213,3 сек.
10 страниц текста будут переданы за 213,3 сек.
Уровень8 класс ПредметИнформатика СложностьПростая
Документ содержит точечную черно-белую фотографию 10 х 15 см. Каждый квадратный сантиметр содержит 600 точек, каждая точка описывается 4 битами. Каков общий информационный объем документа в килобайтах?
Вычислим общее количество точек, содержащихся в фотографии. Обратите внимание, что 600 точек содержит не линейный сантиметр, а квадратный. Таким образом общее число точек будет 10 х 15 х 600 = 9000 точек. Поскольку точка описывается 4 битами, то общее число бит 9000 х 4 = 36000 бит.
Переведем биты в байты и получим 36000 : 8 = 4500 байт
Переведем байты в килобайты 4500 : 1024 = 4,39 килобайт.
Уровень8 класс ПредметИнформатика СложностьПростая
Метеорологическая станция ведет наблюдение за атмосферным давлением. Результатом одного измерения является целое число, принимающее значение от 720 до 780 мм ртутного столба, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений, Определите информационный объем результатов наблюдений.
Определим количество значений, которое надо закодировать. Это 61 значение.
780 — 720 + 1 = 61 (проверьте формулу на интервале по номерам очереди с 3 до 5).
Полученное число — это неопределенность. Значит для кодирования одного значения по формуле Хартли требуется 6 бит информации.
Сделано 80 измерений, получено 6 х 80 = 480 бит или 480 : 8 = 60 байт информации.
Уровень8 класс ПредметИнформатика СложностьПростая
Информационный объем текста, набранного на компьютере с использованием кодировки UNICODE (каждый символ кодируется 16 битами), — 2 Кб. Определить количество символов в тексте.
Чтобы определить количество символов в тексте, надо знать информационный объем всего текста и информационный вес одного символа.
Однако прежде, чем выполнять деление, необходимо привести величины к одинаковым единицам измерения.
2 кб= 2 х 1024 = 2048 байт весь объем информации.
каждый символ кодируется 16 битами или 2 байтами. Отсюда 2048 : 2 = 1024 символа в тексте.
Уровень8 класс ПредметИнформатика СложностьПростая
В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 70 велосипедистов?
Т.к. в велокроссе участвуют 119 спортсменов, необходимо 119 различных номеров. Для кодирования 119 различных номеров необходимо минимум 7 бит на один номер (при помощи 6 бит можно закодировать 26=64 номеров, 7 бит – 27=128 номеров).
После прохождения промежуточного финиша в памяти устройства оказалось 70 номеров, т.е. 70*7=490 бит информации. Т.о. информационный объем сообщения равен 490 бит.
информационный объем сообщения равен 490 бит.
Уровень8 класс ПредметИнформатика СложностьПростая
Световое табло состоит из лампочек. Каждая лампочка может находиться в одном из трех состояний («включено», «выключено» или «мигает»). Какое наименьшее количество лампочек должно находиться на табло,чтобы с его помощью можно было передать 18 различных сигналов?
В данной задаче мощность алфавита равна трем («включено», «выключено» или «мигает»).
Количество необходимых сигналов 18, следовательно
18=3N,
N=3
Количество лампочек равно 3.
Уровень8 класс ПредметИнформатика СложностьПростая
Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.
Определим информационный объем одного измерения: количество возможных вариантов равно 100 (т.к. результатом одного измерения является целое число от 0 до100 процентов), следовательно, информационный объем одного варианта измерения находится по формуле:
100 = 2×I, I = 7 бит.
Так как станция сделала 80 измерений, следовательно, информационный объем результатов наблюдений равен
7×80 = 560 бит
Переведем биты в байты:
560/8 = 70 байт
Информационный объем результатов наблюдений равен 70 байтам.
Уровень8 класс ПредметИнформатика СложностьПростая
Сколько существует различных последовательностей из символов «плюс» и «минус», длиной ровно в пять символов?
Мощность алфавита равна 2. Длина слова равна 5.
Количество различных последовательностей
К = 25 = 32
Количество различных последовательностей 32
Уровень8 класс ПредметИнформатика СложностьПростая
Для кодирования сообщений решено использовать последовательности разной
длины, состоящие из знаков «+» и «-». Сколько различных сообщений можно
закодировать, используя в каждом из них не менее 2-х и не более 6
знаков?
Мощность алфавита равна 2 (знаки «+» и «-»).
Количество различных сообщений для слов из 2-ух букв равно
22=4, для 3-ех букв 23=8, для 4-ех 24=16, для 5-и 25=32, для 6-и 26=64.
Нам осталось только просуммировать значения различных слов:
4+8+16+32+64=124
Можно закодировать 124 различных сообщений.
Уровень8 класс ПредметИнформатика СложностьПростая
В корзине лежат 8 черных шаров и 24 белых.Сколько бит информации несет сообщение о том, что достали черный шар?
Черные шарики составляют 1/4 из всех шаров, следовательно информация о том что достали черный шарик соответствует одному из 4 вариантов.
1 из 4 вариантов несет в себе количество информации равное 2 (4=22).
Также можно решить данную задачу по формуле Шеннона:
количество вариантов получения черного шарика равна 4, следовательно,
I=log24 = 2 бита.
Уровень8 класс ПредметИнформатика СложностьПростая
В коробке лежат 64 цветных карандаша. Сообщение о том, что достали белый карандаш, несет 4 бита информации. Сколько белых карандашей было в коробке?
Определим количество возможных событий (вариантов получения белого карандаша) по формуле Шеннона:
log2N=4, следовательно, N=16.
Количество возможных событий получения белого карандаша равно 16, следовательно, количество белых карандашей составляет 1/16 всех карандашей.
Всего карандашей 64, следовательно белых карандашей 64/16=4.
Уровень8 класс ПредметИнформатика СложностьПростая
В некоторой стране автомобильный номер длиной 5 символов составляется из заглавных букв (всего используется 30 букв) и десятичных цифр в любом порядке. Каждый символ кодируется одинаковым и минимально возможным количеством бит, а каждый номер – одинаковым и минимально возможным количеством байт. Определите объем памяти, необходимый для хранения 50 автомобильных номеров.
Количество символов используемых для кодирования номера составляет:
30 букв + 10 цифр = 40 символов.
Количество информации несущий один символ равен 6 бит (2I=40, но количество информации не может быть дробным числом, поэтому берем ближайшую степень двойки большую количества символов 26=64).
Мы нашли количество информации заложенное в каждом символе, количество символов в номере равно 5, следовательно 5*6=30 бит. Каждый номер равен 30 битам информации, но по условию задачи каждый номер кодируется одинаковым и минимально возможным количеством байт, следовательно нам необходимо узнать сколько байт в 30 битах. Если разделить 30 на 8 получится дробное число, а нам необходимо найти целое количество байт на каждый номер, поэтому находим ближайший множитель 8-ки который превысит количество бит, это 4 (8*4=32).
Каждый номер кодируется 4 байтами.
Для хранения 50 автомобильных номеров потребуется: 4*50=200 байт.
Уровень8 класс ПредметИнформатика СложностьПростая
Если материал понравился Вам и оказался для Вас полезным, поделитесь им со своими друзьями!
Bitcoin, Биткойн, часто Биткоин (от англ. bit — единица информации «бит», англ. coin — «монета») — пиринговая (как торрент или e-mule) электронная платёжная система, использующая одноимённую виртуальную валюту.
1 зиверт — это количество энергии, поглощённое килограммом биологической ткани, равное по воздействию поглощенной дозе 1 Гр.
Информационный объем текста складывается из информационных весов составляющих его символов.
Лошадиная сила — единица мощности. Она примерно равна значению в 75 кгс/м/с., что соответствует усилию, которое необходимо затратить для подъёма груза в 75 кг. на высоту одно метра за одну секунду.
Система древнерусских мер длины включала в себя следующие основные меры: версту, сажень, аршин, локоть, пядь и вершок.
Количество теплоты – это физическая величина, показывающая, какая энергия передана телу в результате теплообмена.
Невозможно создать круговой процесс, результатом которого станет исключительно превращение теплоты, которое получено от нагревателя, в работу.
Мощность – это скорость расходования энергии, выраженная в отношении энергии ко времени: 1 Вт = 1 Дж/1 с. Один ватт равен отношению одного джоуля (единице измерения работы) к одной секунде.
Алгебраическая сумма электрических зарядов в замкнутой системе остается постоянной.
В «современном» латинском алфавите 26 букв.
Американский нефтяной баррель равен 42 галлонам в английской системе мер или 158,988 л в метрической системе.
Сила взаимодействия двух неподвижных точечных электрических зарядов в вакууме прямо пропорциональна произведению их модулей и обратно пропорциональна квадрату расстояния между ними.