Какое количество байт информации содержится в 1 мбайте
Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 31 августа 2019;
проверки требуют 6 правок.
У этого термина существуют и другие значения, см. Byte.
Байт (англ. byte) (русское обозначение: байт и Б; международное: B, byte)[1] — единица хранения и обработки цифровой информации; совокупность битов, обрабатываемая компьютером одновременно. В современных вычислительных системах байт состоит из 8 бит и, соответственно, может принимать одно из 256 (от 0 до 255) различных значений (состояний, кодов). Однако в истории компьютерной техники существовали решения с иными размерами байта (например, 6, 32 или 36 бит), поэтому иногда в компьютерных стандартах и официальных документах для однозначного обозначения группы из 8 бит используется термин «октет» (лат. octet).
В большинстве вычислительных архитектур байт — это минимальный независимо адресуемый набор данных.
История[править | править код]
Название «байт» было впервые использовано в июне 1956 года В. Бухгольцем (англ. Werner Buchholz) при проектировании первого суперкомпьютера IBM 7030 Stretch для пучка одновременно передаваемых в устройствах ввода-вывода битов числом от одного до шести. Позже, в рамках того же проекта, байт был расширен до восьми бит. Слово byte было выбрано как намеренно искажённое слово bite, произносящееся так же (англ. bite — «кусок»; «часть чего-либо, отделённая за один укус»; ср. также появившееся позже название для 4-битной единицы «ниббл» от англ. nibble — «покусывать»). Изменённое написание byte через y вместо i потребовалось, чтобы избежать смешения со словом «бит» (bit)[2]. В печати слово byte впервые появилось в июне 1959 года[3].
Ряд ЭВМ 1950-х и 1960-х годов (БЭСМ-6, М-220) использовали 6-битные символы в 48-битных или 60-битных машинных словах. В некоторых моделях ЭВМ производства Burroughs Corporation (ныне Unisys) размер символа был равен 9 битам. В советской ЭВМ Минск-32 использовался 7-битный байт.
Байтовая адресация памяти была впервые применена в системе IBM System/360. В более ранних компьютерах адресовать можно было только целиком машинное слово, состоявшее из нескольких байтов, что затрудняло обработку текстовых данных.
8-битные байты были приняты в System/360, вероятно, из-за использования BCD-формата представления чисел: одна десятичная цифра (0—9) требует 4 бита (тетраду) для хранения; один 8-битный байт может представлять две десятичные цифры. Байты из 6 бит могут хранить только по одной десятичной цифре, два бита остаются незадействованными.
По другой версии, 8-битный размер байта связан с 8-битным же числовым представлением символов в кодировке EBCDIC.
По третьей версии, из-за двоичной системы кодирования в компьютерах наиболее выгодными для аппаратной реализации и удобными для обработки данных являются длины слов, кратные степеням двойки, в том числе и 1 байт = 23 = 8 бит. Системы и компьютеры с длинами слов, не кратными числу 2, отпали из-за невыгодности и неудобства.
Постепенно 8-битные байты стали стандартом де-факто; с начала 1970-х в большинстве компьютеров байты состоят из 8 бит, а размер машинного слова кратен 8 битам.
Количество состояний (кодов) в байте[править | править код]
Количество состояний (кодов, значений), которое может принимать 1 восьмибитный байт с позиционным кодированием, определяется в комбинаторике. Оно равно количеству размещений с повторениями и вычисляется по формуле:
возможных состояний (кодов, значений), где
Производные единицы[править | править код]
Кратные и дольные приставки для образования производных единиц для байта применяются не как обычно. Уменьшительные приставки не используются совсем, а единицы измерения информации, меньшие, чем байт, называются специальными словами — ниббл (тетрада, полубайт) и бит. Увеличительные приставки кратны либо 1024 = 210, либо 1000 = 103: 1 кибибайт равен 1024 байтам, 1 мебибайт — 1024 кибибайтам или 1024×1024 = 1 048 576 байтам и т. д. для гиби-, теби- и пебибайтов. В свою очередь 1 килобайт равен 1000 байтам, 1 мегабайт — 1000 килобайтам или 1000×1000 = 1 000 000 байтам и т. д. для гига-, тера- и петабайт. Разница между ёмкостями (объёмами), выраженными в кило = 103 = 1000 и выраженными в киби = 210 = 1024, возрастает с ростом веса приставки. МЭК рекомендует использовать двоичные приставки — кибибайт, мебибайт, йобибайт и т. п.
Иногда десятичные приставки используются и в прямом смысле, например, при указании ёмкости жёстких дисков: у них гигабайт (гибибайт) может обозначать не 1 073 741 824 = 10243 байтов, а миллион килобайтов (кибибайтов), то есть 1 024 000 000 байтов, а то и просто миллиард байтов.
Обозначение[править | править код]
Использование русской прописной буквы «Б» для обозначения байта регламентирует Межгосударственный (СНГ) стандарт ГОСТ 8.417-2002[4] («Единицы величин») в «Приложении А» и Постановление Правительства РФ от 31 октября 2009 г. № 879. Кроме того, констатируется традиция использования приставок СИ вместе с наименованием «байт» для указания множителей, являющихся степенями двойки (1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т. д., причём вместо строчной «к» используется прописная «К»), и упоминается, что подобное использование приставок СИ не является корректным. По ГОСТ IEC 60027-2-2015 строчная «к» соответствует 1000 и «Ки» — 1024, так 1 КиБ = 1024 Б, 1 кБ = 1000 Б.
Использование прописной буквы «Б» для обозначения байта соответствует требованиям ГОСТ и позволяет избежать путаницы между сокращениями от байт и бит. Запись со строчной буквой в виде «Кб» (Мб, Гб) для обозначения байта будет не соответствовать международному стандарту IEC (и локализованному по нему ГОСТ). Однако авторы орфографического словаря[5] приводят строчную форму «б» (и «Кб», «Мб», «Гб») для байта, как не образованную от фамилии.
Следует учитывать, что в ГОСТ 8.417, кроме «бит», для бита нет однобуквенного обозначения, поэтому использование записи вроде «Мб» как синонима для «Мбит» не соответствует этому стандарту. Но в некоторых документах используется сокращение b для bit: IEEE 1541-2002, IEEE Std 260.1-2004, в нижнем регистре: ГОСТ Р МЭК 80000-13—2016, ГОСТ IEC 60027-2-2015.
В международном стандарте МЭК IEC 60027-2 от 2005 года[6] для применения в электротехнической и электронной областях рекомендуются обозначения:
- bit — для бита;
- o, B — для октета, байта. Причём о — единственное указанное обозначение во французском языке.[источник?]
Склонение[править | править код]
Кроме обычной формы родительного падежа множественного числа (байтов, килобайтов, битов) существует счётная форма «байт»[7], которая используется в сочетании с числительными: 8 байт, 16 килобайт. Счётная форма является разговорной. Точно так же, например, с килограммами: обычная форма родительного падежа употребляется, если нет числительного, а в сочетании с числительным могут быть варианты: 16 килограммов (стилистически нейтральная обычная форма) и 16 килограмм (разговорная счётная форма).
См. также[править | править код]
- Машинное слово
- Двоичная система счисления
- Генетический код
- Трайт
Примечания[править | править код]
- ↑ Положение о единицах величин, допускаемых к применению в Российской Федерации. Утверждено Постановлением Правительства РФ от 31 октября 2009 г. № 879 (недоступная ссылка). Дата обращения 23 июля 2015. Архивировано 2 ноября 2013 года.
- ↑ Buchholz W. The Word ‘Byte’ Comes of Age… (англ.) // Byte Magazine. — 1977. — Vol. 2, iss. 2. — P. 144.
- ↑ Blaauw G. A., Brooks F. P., Buchholz W. Processing Data in Bits and Pieces (англ.) // IRE Transactions on Electronic Computers. — June 1959. — P. 121.
- ↑ ГОСТ 8.417-2002 («Единицы величин») «Приложение А» Архивная копия от 8 ноября 2015 на Wayback Machine.
- ↑ Приложение 1 Основные общепринятые графические сокращения // Русский орфографический словарь: около 200 000 слов / Российская академия наук. Институт русского языка имени В. В. Виноградова / Под. ред. В. В. Лопатина О. Е. Ивановой. — 4-е, испр. и доп. — М.: АСТ-ПРЕСС КНИГА, 2013. — С. 859—872. — 896 с. — (Фундаментальные словари русскою языка). — ISBN 978-5-462-01272-3.
- ↑ фр. NORME INTERNATIONALE CEI, Troisième édition, англ. INTERNATIONAL STANDARD IEC, Third edition — 60027-2, от 2005-08, с. 5, 112—117.
- ↑ Русский орфографический словарь: около 180 000 слов [Электронная версия] / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — 2-е изд., испр. и доп. — М.: Российская академия наук. Институт русского языка имени В. В. Виноградова, 2004. — 960 с. — ISBN 5-88744-052-X.
Ссылки[править | править код]
- ГОСТ 8.417-2002 («Единицы величин») «Приложение А»
Думаю, про биты и про байты Вы уже знаете, и про килобайты с мегабитами тоже… но всё ли Вы про них знаете? Давайте проверим, ответьте, пожалуйста, мне на вопрос:
Как Вы думаете, сколько в одном килобайте содержится байт? Может быть 1024? Или все-таки 1000?
Правильный ответ в этом IT-уроке.
Результаты опроса «Сколько в килобайте байт?»
Как Вы знаете, я провел опрос на эту тему: на сайте, в социальной сети ВКонтакте и среди моих студентов.
Вот какие получились результаты в сумме:
На самом деле оба первых варианта только частично верны. А правильный ответ вы узнаете из этого IT-урока.
Единицы измерения информации:
То, что компьютер хранит информацию в виде нолей «0» и единиц «1» (используется двоичная система счисления), мы уже узнали в третьем IT-уроке.
Теперь вспомним (или узнаем) про основные единицы измерения данных.
Бит (bit) – базовая единица измерения информации, может содержать только одну двоичную цифру. Бит может принимать только два значения: «0» или «1».
Байт (byte) – также единица количества информации, один байт равен восьми битам (1 Байт = 8 бит).
Это довольно маленькие объемы данных (можно сравнить с измерением веса в «граммах»), поэтому…
Приставки К, М, Г, Т («кило-», «киби-» и т.д.)
…чтобы измерять большие объемы данных, используют кратные приставки (это как «килограмм»). Привычная же нам приставка «кило-» означает умножение на 1000 (103), но в двоичной системе счисления используют два в десятой степени (210).
Давайте же вместе с сайтом IT-уроки разберемся в этом запутанном вопросе.
История введения двоичных приставок
Для обозначения величины 210=1024 байт, ввели двоичную приставку «К» (именно прописная буква «К»), но в разговорной речи единицу «К» стали называть «кило», что не совсем одно и то же. Чтобы избежать путаницы, ввели названия приставкам:
К — «киби»,
М — «меби»,
Г — «гиби»,
Т — «теби»…
Т.е. второй слог изменили с привычного на «би», «бинарный».
Но путаница не исчезла, многие расшифровывали «К» и «М» привычными «кило» и «мега». Даже международные стандарты по-разному интерпретировали расшифровку двоичных приставок. Кроме того, производители добавили масла в огонь внесли свой вклад в запутывание ситуации (одни считали 210, другие 103).
В итоге, чтобы окончательно убрать несоответствие, изменили не только названия, но и приставки:
Ки — «киби»,
Ми — «меби»,
Ги — «гиби»,
Ти — «теби»…
Как Вы думаете, помогло? Конечно же, нет ????
В обиходе говорят «кило», в программах ОС Windows пишут «К», в Linux обозначают «Ки», производители жестких и оптических дисков пишут «К», а имеют в виду «Ки» и т.д.
Что же делать обычному пользователю?
Если подвести итог всему сказанному, то на сегодняшний день три варианта использования двоичных приставок, их мы и сведем в три таблицы.
1. Обычное использование двоичных приставок
В свойствах файлов почти все программы, да и сама операционная система Windows использует приставку в виде прописной буквы «К», «М», «Г» и т.д. Производители оперативной памяти используют тот же принцип. То есть можно пользоваться следующей таблицей:
Эта «К» на самом деле двоичная приставка «киби» (а не «кило», как все говорят).
2. Правильное использование двоичных приставок
В других операционных системах, а также в профессиональных обзорах серьезных ИТ-изданий сразу пишут «Киб», «МиБ», «ГиБ», чтобы не было сомнений, о чем идет речь.
3. Использование десятичных приставок
Производители накопителей (жестких дисков (HDD), карт флэш-памяти, а также DVD и BD-дисков) используют десятичные приставки. Эти же приставки используются при обозначении скорости передачи данных (100 Мбит/с = 100 000 000 бит/с, об этом в следующем IT-уроке).
Если используется приставка «кило», «мега», «гига» и т.д., то имеются в виду следующие соотношения:
Куда исчезли 70 гигабайт на жестком диске???
Посмотрим, как Windows видит два моих жестких диска 500 ГБ и 1 ТБ:
Наверное, Вы уже догадались, почему жесткий диск объемом 1 Терабайт в ОС Windows отображается как 931 ГБ, а не 1000.
Производители считают, что в нем 1 000 000 000 килобайт, а ОС Windows делит на 1024 и получает 976 562 500 Кбайт (кибибайт) или 931 Гбайт (гибибайт).
Так что, не ругайте производителей и уж тем более компьютерную фирму, всё отмерено верно, но разными рулетками ????
Т.е. 70 гигабайт никуда не делись, просто гибибайт на жестком диске меньше, чем гигабайт.
Не запутались? Тогда еще один пример.
«Почему на флешке меньше места?»
То же самое и с флэш-накопителями. Если Вы посмотрите на свойства своей флэшки, то (к примеру) вместо 16 GB, указанных на корпусе, увидите 14.9 ГБ!!!
Теперь Вы знаете, что 1.1 ГБ «потерялся» при пересчете из килобайт в кибибайты.
Заключение
Разобрались? Теперь Вы знаете ответ на вопрос, сколько байт в килобайте, а сколько в кибибайте (бит в килобите и в кибибите). Вот последняя картинка, которая должна окончательно развеять все сомнения при ответе на вопрос «сколько в килобайте байт?»:
Как Вам урок? Жду Ваших отзывов в комментариях!
Автор: Сергей Бондаренко https://it-uroki.ru/
Копирование запрещено
Всё перечисленное в этом уроке в сокращенном виде я занес в справочник ПО.
А в следующем уроке мы узнаем, как измеряется скорость передачи данных и как хитрят провайдеры, рекламирующие свои «огромные» скорости подключения к Интернету.
Чтобы не пропустить новый урок, подписывайтесь на новости по вот этой ссылке (а в пришедшем письме подтвердите подписку).
Поделитесь с друзьями:
Понравились IT-уроки?
Все средства идут на покрытие текущих расходов (оплата за сервер, домен, техническое обслуживание)
и подготовку новых обучающих материалов (покупка необходимого ПО и оборудования).
Много интересного в соц.сетях:
Единицы измерения информации
Для информации существуют свои единицы измерения информации.
Если рассматривать сообщения информации как последовательность знаков,
то их можно представлять битами, а измерять в байтах, килобайтах,
мегабайтах, гигабайтах, терабайтах и петабайтах.
Давайте разберемся с этим, ведь нам придется измерять объем памяти и быстродействие компьютера.
Бит
Единицей измерения количества информации является бит – это наименьшая (элементарная) единица.
1бит – это количество информации, содержащейся в сообщении, которое вдвое уменьшает неопределенность знаний о чем-либо.
Байт
Байт – основная единица измерения количества информации.
Байтом называется последовательность из 8 битов.
Байт – довольно мелкая единица измерения информации. Например, 1 символ – это 1 байт.
Производные единицы измерения количества информации
1 байт=8 битов
1 килобайт (Кб)=1024 байта =210 байтов
1 мегабайт (Мб)=1024 килобайта =210 килобайтов=220 байтов
1 гигабайт (Гб)=1024 мегабайта =210 мегабайтов=230 байтов
1 терабайт (Гб)=1024 гигабайта =210 гигабайтов=240 байтов
Запомните, приставка КИЛО в информатике – это не 1000, а 1024, то есть 210 .
Методы измерения количества информации
Итак, количество информации в 1 бит вдвое уменьшает неопределенность знаний. Связь же между количеством возможных событий N и количеством информации I определяется формулой Хартли:
Алфавитный подход к измерению количества информации
При этом подходе отвлекаются от содержания (смысла) информации и
рассматривают ее как последовательность знаков определенной знаковой
системы. Набор символов языка, т.е. его алфавит можно рассматривать как
различные возможные события. Тогда, если считать, что появление символов
в сообщении равновероятно, по формуле Хартли можно рассчитать, какое
количество информации несет в себе каждый символ:
Вероятностный подход к измерению количества информации
Этот подход применяют, когда возможные события имеют различные
вероятности реализации. В этом случае количество информации определяют
по формуле Шеннона:
.
, где
I – количество информации,
N – количество возможных событий,
Pi – вероятность i-го события.
Задача 1.
Шар находится в одной из четырех коробок. Сколько бит информации несет сообщение о том, в какой именно коробке находится шар.
Имеется 4 равновероятных события (N=4).
По формуле Хартли имеем: 4=2i. Так как 22=2i, то i=2. Значит, это сообщение содержит 2 бита информации.
Задача 2.
Чему равен информационный объем одного символа русского языка?
В русском языке 32 буквы (буква ё обычно не используется), то есть количество событий будет равно 32. Найдем информационный объем одного символа. I=log2 N=log2 32=5 битов (25=32).
Примечание. Если невозможно найти целую степень числа, то округление производится в большую сторону.
Задача 3.
Чему равен информационный объем одного символа английского языка?
Задача 4.
Световое табло состоит из лампочек, каждая из которых может
находиться в одном из двух состояний (“включено” или “выключено”). Какое
наименьшее количество лампочек должно находиться на табло, чтобы с его
помощью можно было передать 50 различных сигналов?
С помощью N лампочек, каждая из которых может находиться в одном из двух состояний, можно закодировать 2N сигналов.
25< 50 <26, поэтому пяти лампочек недостаточно, а шести хватит. Значит, нужно 6 лампочек.
Задача 5.
Метеостанция ведет наблюдения за влажностью воздуха.
Результатом одного измерения является целое число от 0 до 100, которое
записывается при помощи минимально возможного количества битов. Станция
сделала 80 измерений. Определите информационный объем результатов
наблюдений.
В данном случае алфавитом является множество чисел от 0 до 100, всего
101 значение. Поэтому информационный объем результатов одного измерения
I=log2101. Но это значение не
будет целочисленным, поэтому заменим число 101 ближайшей к нему степенью
двойки, большей, чем 101. это число 128=27. Принимаем для одного измерения I=log2128=7 битов. Для 80 измерений общий информационный объем равен 80*7 = 560 битов = 70 байтов.
Задача 6.
Определите количество информации, которое будет получено
после подбрасывания несимметричной 4-гранной пирамидки, если делают один
бросок.
Пусть при бросании 4-гранной несимметричной пирамидки вероятности отдельных событий будут равны: p1=1/2, p2=1/4, p3=1/8, p4=1/8.
Тогда количество информации, которое будет получено после реализации одного из них, можно вычислить по формуле Шеннона:
I = -[1/2 * log2(1/2) + 1/4 * log2(1/4) + 1/8 * log(1/8) + 1/8 * log(1/8)] = 14/8 битов = 1,75 бита.
Задача 7.
В книге 100 страниц; на каждой странице — 20 строк, в каждой
строке — 50 символов. Определите объем информации, содержащийся в книге.
Задача 8.
Оцените информационный объем следующего предложения:
Тяжело в ученье – легко в бою!
Так как каждый символ кодируется одним байтом, нам только нужно
подсчитать количество символов, но при этом не забываем считать знаки
препинания и пробелы. Всего получаем 30 символов. А это означает, что
информационный объем данного сообщения составляет 30 байтов или 30 * 8 = 240 битов.