Какое количество информации содержится в слове информация

Анонимный вопрос · 3 мая 2018

4,5 K

Кандидат физ.-мат. наук, делаю Яндекс, увлекаюсь всем на свете

Если бы этот вопрос задали моему ребенку на уроке информатики, то я бы, чтобы помочь ему получить хорошую оценку, ответил, что 88. Сейчас объясню, как обосновать этот ответ в школе, и почему он при этом не совсем правильный, а в настоящем программировании всё сложнее.

В слове «информатика» 11 букв. Каждую букву мы можем закодировать одним байтом. В одном байте 8 бит, поэтому ответ 11х8=88.

Как это проверить? Очень просто, запустите на компьютере «Блокнот» (я предполагаю, что у вас Windows), напечатайте в нём это слово и сохраните в текстовый файл. Кликните правой кнопкой, выберите «свойства», видите? Размер: 11 байт (то есть 88 бит).

Теперь о том, почему в реальности всё сложнее. Мы выше написали, что каждую букву мы закодируем одним байтом. Всего разных символов у нас, таким образом, может быть максимум столько, сколько разных значений у одного байта, то есть 2 в восьмой степени, 256. Это значит, что все буквы всех алфавитов мира в один байт точно не влезут. Даже одни только японские или китайские иероглифы в один байт не вмещаются.

То есть кодировка, какому значению байта соответствует какая буква, это вовсе не универсальная штука, они бывают разные. В «Блокноте» и много где ещё в Windows используется кодировка Windows-1251 (это если вы в России живете, в других странах другие). В некоторых кодировках слово «информатика» просто нельзя записать. А в Windows-1251 нельзя записать слово 信息学. Если вы свой текстовый файлик, содержащий слово «информатика», пришлёте китайцу, он, открыв его, увидит какую-то абракадабру, и наоборот. Так что ответ «11 байт или 88 бит» предполагает, что мы с получателем используем одну и ту же однобайтовую кодировку, содержащую кириллические буквы.

А есть такой стандарт кодирования, в котором можно написать что угодно и не устраивать вот этих сложностей? Как ни странно, есть! Он называется Unicode, и в ней каждому символу всех алфавитов Земли (даже вымершим языкам, даже египетским иероглифам, даже смайликам и эмоджи) присвоен свой код. Естественно, в нём много тысяч символов и в один байт всё это не влезет. Unicode можно для компьютера кодировать по-разному, но самый популярный вариант устроен так. В нём самые распространенные символы (цифры, точки-запятые-скобки и буквы латинского алфавита) занимают один байт, чуть менее распространенные (кириллические буквы, а также всякие там Ä и π) два байта, а всякая экзотика вроде индейских узелковых письменностей и четыре может занимать.

С каждым годом Unicode становится всё более популярным, а «старые» кодировки вроде Windows 1251, господствовавшие, когда писался школьный учебник по информатике, уходят на второй план. Так что по-честному я бы ответил, что в слове «информатика» 22 байта = 176 бит, ну, насколько уж этот вопрос вообще имеет смысл.

Вы тоже забыли символ конца строки 🙂

Смотря какой алфавит Вы используете.
Если алфавит — просто строчные русские буквы, то всего имеется 33 символа. В таком случае, для кодировки каждого символа понадобится 6 бит (2^5 < 33, 2^6 >= 33 — берем ближайшую степень двойки, которая вместит наш алфавит). Значит, для кодировки слова «информатика», где 11 букв, нужно будет 66 бит.
По образу и… Читать далее

Вы символ конца строки забыли 🙂 То есть всего будет 72 бита.

Вероятно, «66 бит» считается правильным ответом в… Читать дальше

Админы, хватит ломать сайт!!! Не прикрепляются теперь фото в ответы, т.к. объём фото в байтах плюсуется (судя по всему) к количеству букв в ответе. И сайт ругается, что ответ больше 32000 букв!!!?

Комьюнити-менеджер Яндекс.Кью ???? Отвечаю на вопросы о сервисе, помогаю…

Егор, привет! К сожалению, сайту сейчас очень плохо технически, мы бросаем все силы, чтобы решить проблемы. Помогите нам, пожалуйста, подскажите, с какого устройства воспроизводится проблема, с какого браузера вы работаете и какая ОС установлена? Если устройств несколько — пишите обо всех. Спасибо большое

Почему в одном КилоБайте именно 1024 байта?

Отвечаю на вопросы о буддийских традициях. Проектирую шрифты.

Легко находится. Исторически сложилось, что для двоичной системы удобнее, когда в байте 8 бит. Если бы в байте было 10 бит, то в килобайте удобнее было бы считать 1000 байт:

Бит — очень маленькая единица информации. Работать с каждым битом отдельно, конечно, можно, но это малопроизводительно. Обработкой информации в компьютере занимается специальная микросхема, которая называется процессор. Эта микросхема устроена так, что может обрабатывать группу битов одновременно (параллельно).

Один из первых персональных компьютеров (Altair, 1974 г.) имел восьмиразрядный процессор, то есть он мог параллельно обрабатывать восемь битов информации. Это в восемь раз быстрее, чем работать с каждым битом отдельно, поэтому в вычислительной технике появилась новая единица измерения информации — байт. Байт — это группа из восьми битов.

Мы знаем, что один бит может хранить в себе один двоичный знак — 0 или 1. Это наименьшая единица представления информации — простой ответ на вопрос Да или Нет. А что может хранить байт?

На первый взгляд кажется, что раз в байте восемь битов, то и информации он может хранить в восемь раз больше, чем один бит, но это не так. Дело в том, что в байте важно не только, включен бит или выключен, но и то, в каком месте стоят включенные биты. Байты 0000 0001, 0000 1000 и 1000 0000 — не одинаковые, а разные.

Если учесть, что важны не только нули и единицы, но и позиции, в которых они стоят, то с помощью одного байта можно выразить 256 различных единиц информации (oт 0 до 255).

Всегда ли байты состояли из восьми битов? Нет, не всегда. Еще в 60-е годы, когда не было персональных компьютеров и все вычисления проводились на больших электронно-вычислительных машинах (ЭВМ), байты могли быть какими угодно. Наиболее широко были распространены ЭВМ, у которых байт состоял из шести битов, но были и такие, у которых он состоял из четырех и даже из семи битов.

Восьмибитный байт появился достаточно поздно (в начале семидесятых годов), но быстро завоевал популярность. С тех пор понятие о байте, как о группе из восьми битов, является общепризнанным.

1 Килобайт = 1024 байт = 2 в 10-й степени байт

1 Мегабайт = 1024 Кбайт = 2 в 20-й степени байт

1 Гигабайт = 1024 Мбайт = 2 в 30-й степени байт

Прочитать ещё 2 ответа

Чем отличается 8-Битная музыка от 16-битной?

Отличие заключается в том, какой объем информации мы можем использовать для каждого фиксированного блока данных. Разбиение непрерывного аналогового потока данных на конечное число интервалов в цифровом формате — это квантование. Если каждый дискретный интервал будет описан при помощи 8 бит — мы сможем использовать диапазон от −128 до +127 для определения положения точки начала каждого последующего дискретного интервала. Именно этот фактор в первую очередь определяет такой бедный диапазон и низкое качество 8-Битного звука.

Если же при квантовании использовать 16-Битные значения, мы сможем использовать диапазон от −32,768 до +32,767, что соответствует качеству звука формата AudioCD.

Где используются системы счисления?

Учитель математики, физики и информатики. Веб-программист.

Системы счисления используются в компьютерной графике: RGB = Red Green Blue, получение любого цвета из 256 оттенков голубого, красного и зеленого. Сочетание дает 16.7млн цветов на мониторе. 256 — это 16*16, таким образом, можно записать любой цвет 6 символами, например ff, ff, ff означает 255, 255, 255 и вместо 255255255 в коде встречается более короткая запись ffffff.

Любые данные в компьютере кодируются в двоичный код из 0 и 1. Ими можно закодировать текст, символы, операции, программы, музыку, фото, видео и любую другую информацию. Чтобы оптимизировать код и он не был слишком громоздким, используется множество алгоритмов кодирования.

Время измеряется в шестидесятеричной системе счисления (после 60 секунд наступает новая минута, после 60 минут наступает новый час).

А еще есть двенадцатеричная система счисления. Она удобна тем, что 12 делится на 2,3,4,6

Вообще использование систем счисления обусловлено физическим миром, его свойствами. Если бы компьютеры были построены на квантах и имели 16 состояний, то разумней было бы использовать не двоичную, а шестнадцатеричную систему. 16 еще удобно тем, что это четвертая степень двойки.

В математике применяются любые системы счисления, при том кроме позиционных, существуют и непозиционные. Например римская система счисления.

Прочитать ещё 1 ответ

Как компьютер из бесконечного потока нулей и единиц отделяет одни значения от других? Ведь в двоичной системе нет знаков препинания

Компьютер отделяет так, как ему предписывает отделять программа, которую написал человек.

Когда разрабатывается программа, программист решает, какой способ хранения информации в памяти (или на диске) ему удобнее всего. Для этого существует несколько широко распространённых форматов. Есть стандартные форматы для работы с целыми числами, дробными числами, с наборами чисел, строками и др.

Для примера давайте сперва взглянем на то, как устроено наиболее типичное целое число. Целое число — это ровно 32 бита (нулей и единиц). То есть, если, допустим, программист записывает в память поочерёдно 4 целых числа, то в памяти оказывается 128 (32х4) бит полезной информации. Но мы всегда знаем, что биты с 1-го по 32-й — это первое число, с 33-го по 64-й — это 2-е число и так далее. Так что они не перепутаются.

Вторым примером давайте разберём самый типичный вариант «строки». Строкой называется последовательность бит, в которой каждый символ занимает ровно 8 бит. В этих 8 битах могут быть закодированы буквы, цифры, знак пробела, знаки препинания и разные другие значки. Чтобы хранить символы в виде чисел (поскольку нули и единицы — это числа), был придуман стандарт, по которому, допустим (в реальности это немного не так), число 1 означает букву «А», число 2 означает «Б» и так далее. 8 бит как раз достаточно для того, чтобы хранить основной набор символов.

Строка представляет собой последовательность отдельных символов. Так же, как и с числами, здесь 1-8й биты — это первый символ, 9-16й биты — второй и т. д. Чтобы знать, когда строка заканчивается, существует 2 распространённых подхода. Первый подход заключается в том, чтобы самым первым «символом» строки записать не первый символ, а число, которое равно числу символов в этой строке. Благодаря этому числу программист знает, где заканчивается строка и начинается что-то другое (например, другая строка или же, допустим, какое-нибудь другое нужное число). Другой подход заключается в том, что строка всегда заканчивается числом ноль. Ноль — это знак «конец строки». При таком подходе программа читает символ за символом (по 8 бит) до тех пор, пока не встретится ноль (не путайте число 0, которое записывается в памяти как 00000000 и символ, обозначающий ноль, который записывается как 00110000). Как встретился ноль — значит, дальше уже не строка, а что-то другое.

P. S. В современном программировании почти всеми такими нюансами занимается сам компьютер. То есть, программисту очень редко нужно запоминать, в каком порядке он записывает числа, не нужно мучаться с посимвольным чтением строки в поисках нуля и т. п. Он пишет и видит свою программу в виде довольно приятного построчного текста, где каждому числу, строке (и др.), с которыми ему нужно работать, он назначает имя (например, tekstVoprosa, tekstOtveta, reytingOtveta или чаще по-английски questionText, answerText, answerRaiting) и далее использует это имя. Он может, например, записывать/читать на/с диск-а и не задумываться обо всех этих битах. Компьютер сам проследит, чтобы были записаны правильные биты в правильном порядке.

Источник

Набор символов знаковой системы (алфавит) можно рассматривать как различные возможные состояния (события).
Тогда, если считать, что появление символов в сообщении равновероятно, количество возможных событийN можно вычислить как N=2i
Количество информации в сообщении I можно подсчитать умножив количество символов K на информационный вес одного символа i
Итак, мы имеем формулы, необходимые для определения количества информации в алфавитном подходе:

Если к этим задачам добавить задачи на соотношение величин, записанных в разных единицах измерения, с использованием представления величин в виде степеней двойки мы получим 9 типов задач.
Рассмотрим задачи на все типы. Договоримся, что при переходе от одних единиц измерения информации к другим будем строить цепочку значений. Тогда уменьшается вероятность вычислительной ошибки.

Задача 1. Получено сообщение, информационный объем которого равен 32 битам. чему равен этот объем в байтах?

Решение: В одном байте 8 бит. 32:8=4
Ответ: 4 байта.

Задача 2. Объем информацинного сообщения 12582912 битов выразить в килобайтах и мегабайтах.

Решение: Поскольку 1Кбайт=1024 байт=1024*8 бит, то 12582912:(1024*8)=1536 Кбайт и
поскольку 1Мбайт=1024 Кбайт, то 1536:1024=1,5 Мбайт
Ответ:1536Кбайт и 1,5Мбайт.

Задача 3. Компьютер имеет оперативную память 512 Мб. Количество соответствующих этой величине бит больше:

1) 10 000 000 000бит 2) 8 000 000 000бит 3) 6 000 000 000бит 4) 4 000 000 000бит Решение: 512*1024*1024*8 бит=4294967296 бит.
Ответ: 4.

Задача 4. Определить количество битов в двух мегабайтах, используя для чисел только степени 2.
Решение: Поскольку 1байт=8битам=23битам, а 1Мбайт=210Кбайт=220байт=223бит. Отсюда, 2Мбайт=224бит.
Ответ: 224бит.

Задача 5. Сколько мегабайт информации содержит сообщение объемом 223бит?
Решение: Поскольку 1байт=8битам=23битам, то
223бит=223*223*23бит=210210байт=210Кбайт=1Мбайт.
Ответ: 1Мбайт

Задача 6. Один символ алфавита «весит» 4 бита. Сколько символов в этом алфавите?
Решение:
Дано:

i=4	По формуле N=2i находим N=24, N=16
Найти: N — ?	По формуле N=2i находим N=24, N=16

Ответ: 16

Задача 7. Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите?
Решение:
Дано:

i=8	По формуле N=2i находим N=28, N=256
Найти:N — ?	По формуле N=2i находим N=28, N=256

Ответ: 256

Задача 8. Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита?
Решение:
Дано:

N=32	По формуле N=2i находим 32=2i, 25=2i,i=5
Найти: i— ?	По формуле N=2i находим 32=2i, 25=2i,i=5

Ответ: 5

Задача 9. Алфавит состоит из 100 символов. Какое количество информации несет один символ этого алфавита?
Решение:
Дано:

N=100	По формуле N=2i находим 32=2i, 25=2i,i=5
Найти: i— ?	По формуле N=2i находим 32=2i, 25=2i,i=5

Ответ: 5

Задача 10. У племени «чичевоков» в алфавите 24 буквы и 8 цифр. Знаков препинания и арифметических знаков нет. Какое минимальное количество двоичных разрядов им необходимо для кодирования всех символов? Учтите, что слова надо отделять друг от друга!
Решение:
Дано:

N=24+8=32	По формуле N=2i находим 32=2i, 25=2i,i=5
Найти: i— ?	По формуле N=2i находим 32=2i, 25=2i,i=5

Ответ: 5

Задача 11. Книга, набранная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Ответ дайте в килобайтах и мегабайтах
Решение:
Дано:

K=360000	Определим количество символов в книге 1504060=360000. Один символ занимает один байт. По формуле I=Ki*находим I=360000байт 360000:1024=351Кбайт=0,4Мбайт
Найти: I— ?

Ответ: 351Кбайт или 0,4Мбайт

Задача 12. Информационный объем текста книги, набранной на компьютере с использованием кодировки Unicode, — 128 килобайт. Определить количество символов в тексте книги.
Решение:
Дано:

I=128Кбайт,i=2байт	В кодировке Unicode один символ занимает 2 байта. Из формулыI=Ki* выразимK=I/i,K=128*1024:2=65536
Найти: K— ?

Ответ: 65536

Задача 13.Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Определить информационный вес одного символа использованного алфавита
Решение:
Дано:

I=1,5Кбайт,K=3072	Из формулы I=Ki* выразимi=I/K,i=1,510248:3072=4
Найти: i— ?	Из формулы I=Ki* выразимi=I/K,i=1,510248:3072=4

Ответ: 4

Задача 14.Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет?
Решение:
Дано:

N=64, K=20	По формуле N=2i находим 64=2i, 26=2i,i=6. По формуле I=Ki* I=20*6=120
Найти: I— ?

Ответ: 120бит

Задача 15. Сколько символов содержит сообщение, записанное с помощью 16-символьного алфавита, если его объем составил 1/16 часть мегабайта?
Решение:
Дано:

N=16, I=1/16 Мбайт	По формуле N=2i находим 16=2i, 24=2i,i=4. Из формулы I=Ki* выразим K=I/i, K=(1/16)10241024*8/4=131072
Найти: K— ?

Ответ: 131072

Задача 16. Объем сообщения, содержащего 2048 символов,составил 1/512 часть мегабайта. Каков размер алфавита, с помощью которого записано сообщение?
Решение:
Дано:

K=2048,I=1/512 Мбайт	Из формулы I=Ki* выразим i=I/K, i=(1/512)102410248/2048=8. По формулеN=2i*находим N=28=256
Найти: N— ?

Ответ: 256

Задачи для самостоятельного решения:

Каждый символ алфавита записывается с помощью 4 цифр двоичного кода. Сколько символов в этом алфавите?
Алфавит для записи сообщений состоит из 32 символов, каков информационный вес одного символа? Не забудьте указать единицу измерения.
Информационный объем текста, набранного на компьюте¬ре с использованием кодировки Unicode (каждый символ кодируется 16 битами), — 4 Кб. Определить количество символов в тексте.
Объем информационного сообщения составляет 8192 бита. Выразить его в килобайтах.
Сколько бит информации содержит сообщение объемом 4 Мб? Ответ дать в степенях 2.
Сообщение, записанное буквами из 256-символьного ал¬фавита, содержит 256 символов. Какой объем информации оно несет в килобайтах?
Сколько существует различных звуковых сигналов, состоящих из последовательностей коротких и длинных звонков. Длина каждого сигнала — 6 звонков.
Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 20 до 100%, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатом наблюдений.
Скорость передачи данных через ADSL-соединение равна 512000 бит/с. Через данное соединение передают файл размером 1500 Кб. Определите время передачи файла в секундах.
Определите скорость работы модема, если за 256 с он может передать растровое изображение размером 640х480 пикселей. На каждый пиксель приходится 3 байта. А если в палитре 16 миллионов цветов?

Тема определения количества информации на основе алфавитного подхода используется в заданиях А1, А2, А3, А13, В5 контрольно-измерительных материалов ЕГЭ.

Источник

Свойство полноты информации негласно предполагает, что имеется возможность измерять количество информации. Какое количество информации содержится в данной книге, какое количество информации в популярной песенке? Что содержит больше информации: роман «Война и мир» или сообщение, полученное в письме от товарища? Ответы на подобные вопросы не просты и не однозначны, так как во всякой информации присутствует субъективная компонента. А возможно ли вообще объективно измерить количество информации? Важнейшим результатом теории информации является вывод о том, что в определенных, весьма широких условиях, можно, пренебрегая качественными особенностями информации, выразить ее количество числом, а следовательно, сравнивать количество информации, содержащейся в различных группах данных.

Количеством информации называют числовую характеристику информации, отражающую ту степень неопределенности, которая исчезает после получения информации.

Рассмотрим пример: дома осенним утром, старушка предположила, что могут быть осадки, а могут и не быть, а если будут, то в форме снега или в форме дождя, т.е. «бабушка надвое сказала — то ли будет, то ли нет, то ли дождик, то ли снег». Затем, выглянув в окно, увидела пасмурное небо и с большой вероятностью предположила — осадки будут, т.е., получив информацию, снизила количество вариантов выбора. Далее, взглянув на наружный термометр, она увидела, что температура отрицательная, значит, осадки следует ожидать в виде снега. Таким образом, получив последние данные о температуре, бабушка получила полную информацию о предстоящей погоде и исключила все, кроме одного, варианты выбора.

Приведенный пример показывает, что понятия «информация», «неопределенность», «возможность выбора» тесно связаны. Получаемая информация уменьшает число возможных вариантов выбора (т.е. неопределенность), а полная информация не оставляет вариантов вообще.

За единицу информации принимается один бит (англ, bit — binary digit — двоичная цифра). Это количество информации, при котором неопределенность, т.е. количество вариантов выбора, уменьшается вдвое или, другими словами, это ответ на вопрос, требующий односложного разрешения — да или нет.

Бит — слишком мелкая единица измерения информации. На практике чаще применяются более крупные единицы, например, байт, являющийся последовательностью из восьми бит. Именно восемь битов, или один байт, используется для того, чтобы закодировать символы алфавита, клавиши клавиатуры компьютера. Один байт также является минимальной единицей адресуемой памяти компьютера, т.е. обратиться в память можно к байту, а не биту.

Широко используются еще более крупные производные единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 210 байт,

1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,

1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт,

1 Терабайт (Тбайт) — 1024 Гбайт = 240 байт.

За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная (бит) единица информации. Но данная единица используется редко в компьютерной технике, что связано с аппаратными особенностями компьютеров.

Информационные процессы

Получение информации тесно связано с информационными процессами, поэтому имеет смысл рассмотреть отдельно их виды.

Сбор данных — это деятельность субъекта по накоплению данных с целью обеспечения достаточной полноты. Соединяясь с адекватными методами, данные рождают информацию, способную помочь в принятии решения. Например, интересуясь ценой товара, его потребительскими свойствами, мы собираем информацию для того, чтобы принять решение: покупать или не покупать его.

Передача данных — это процесс обмена данными. Предполагается, что существует источник информации, канал связи, приемник информации, и между ними приняты соглашения о порядке обмена данными, эти соглашения называются протоколами обмена. Например, в обычной беседе между двумя людьми негласно принимается соглашение, не перебивать друг друга во время разговора.

Хранение данных — это поддержание данных в форме, постоянно готовой к выдаче их потребителю. Одни и те же данные могут быть востребованы не однажды, поэтому разрабатывается способ их хранения (обычно на материальных носителях) и методы доступа к ним по запросу потребителя.

Обработка данных — это процесс преобразования информации от исходной ее формы до определенного результата. Сбор, накопление, хранение информации часто не являются конечной целью информационного процесса. Чаще всего первичные данные привлекаются для решения какой-либо проблемы, затем они преобразуются шаг за шагом в соответствии с алгоритмом решения задачи до получения выходных данных, которые после анализа пользователем предоставляют необходимую информацию.

Обобщая сказанное, можно предложить следующую структурную схему (рис. 1.2):

Какое количество информации содержится в слове информация

Рис. 1.2. Структура информатики

Статьи к прочтению:

Понятие нормализации отношений
Понятие об иерархической модели. иерархическая модель visual basic for application.

Какое количество информации содержится в слове информация

Почему в одном КилоБайте именно 1024 байта?

Чем отличается 8-Битная музыка от 16-битной?

Где используются системы счисления?

Как компьютер из бесконечного потока нулей и единиц отделяет одни значения от других? Ведь в двоичной системе нет знаков препинания

Статьи к прочтению:

10 САМЫХ сложных ВАРИАНТОВ выбора (ТЕСТ на ТВОЮ личность)

Похожие статьи: