Единицы измерения ёмкости носителей и объёма информации

Материал из Википедии — свободной энциклопедии
(перенаправлено с «Единицы измерения количества информации»)
Перейти к навигации Перейти к поиску

Единицы количества информации[1] используются в технике[2] для измерения ёмкости компьютерной памяти и объёма данных, передаваемых по каналам связи. В теории информации[1] также используются для определения количества информации как меры изменения энтропии.

Единицы измерения информации

[править | править код]

Большой по размеру объём данных может содержать в себе малое количество информации. Таким образом, объём данных и количество информации являются разными характеристиками в теории информации, но исторически название «количество информации» использовали в значении «объём данных», а для измерения количества информации применяли названия «информационная энтропия» и «ценность информации».

Единицы измерения ёмкости носителей и объёма данных применяются для измерения ёмкости носителей информации — запоминающих устройств и для измерения объёмов данных.

Единицы измерения количества информации применяются для измерения количества информации в объёме данных. Первичной характеристикой объёма данных является количество возможных состояний. Первичной единицей измерения объёма данных является одно возможное состояние (значение, код).

Вторичной характеристикой объёма данных является разряд. Ёмкость (объём) одного разряда может быть разной и зависит от основания применённой системы кодирования. Ёмкости одного разряда в двоичной, троичной и десятичной системах кодирования:

  • один двоичный разряд (бит) имеет 2 взаимоисключающих возможных состояния (значения, кода);
  • один троичный разряд (трит) имеет 3 взаимоисключающих возможных состояния (значения, кода);
  • один десятичный разряд (децит) имеет 10 взаимоисключающих возможных состояний (значений, кодов).

Третичными характеристиками объёма данных являются различные множества разрядов. Ёмкость множества разрядов равна количеству возможных состояний этого множества разрядов, которое определяется в комбинаторике, равно количеству размещений с повторениями и вычисляется по формуле:

возможных состояний (кодов, значений), где:

  •  — количество возможных состояний одного разряда (основание выбранной системы кодирования),
  •  — количество разрядов в множестве разрядов.

Таким образом, ёмкость множества разрядов представляет собой показательную функцию от количества разрядов с основанием, равным количеству возможных состояний одного разряда.

Например, 1 байт состоит из 8 () двоичных разрядов () и может принимать возможных состояний (значений, кодов).

Логарифмические единицы

[править | править код]
Сравнение разных единиц измерения информации. Дискретные величины представлены прямоугольниками, единица «нат» — горизонтальным уровнем. Чёрточки слева — логарифмы натуральных чисел.
Единицы измерения информации бит, нат, трит и бан (децит)

Когда некоторые величины, в том числе и объём данных, представляют собой показательные функции, то, во многих случаях, удобнее пользоваться не самими величинами, а логарифмами этих величин.

Объём данных тоже можно представлять логарифмически, как логарифм количества возможных состояний[3].

Объём информации (объём данных) — может измеряться логарифмически.[4] Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации — складывается. Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.

Для объёмов двоичных данных удобнее пользоваться двоичными логарифмами:

  • возможных состояния, двоичный разряд = 1 бит;
  • возможных состояний, двоичных разрядов = 1 байт (октет);
  • возможных состояния, двоичных разрядов = 1 килобайт (килооктет);
  • возможных состояний, двоичных разрядов = мегабайт (мегаоктет);
  • возможных состояния, двоичных разрядов = 1 гигабайт (гигаоктет);
  • возможных состояний, двоичных разрядов = 1 терабайт (тераоктет).

Наименьшее целое число, двоичный логарифм которого целое положительное, — 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.

Для объёмов троичных данных удобнее пользоваться троичными логарифмами:

  • возможных состояния, троичный разряд (трит);
  • возможных состояний, троичных разрядов (тритов) = 1 Трайт.

Единица, соответствующая числу 3, трит равна log23 ≈ 1,585 бита.

Такая единица как нат (nat), соответствующая натуральному логарифму применяется в инженерных и научных расчётах. В вычислительной технике она практически не применяется, так как основание натуральных логарифмов не является целым числом.

Для объёмов десятичных данных удобнее пользоваться десятичными логарифмами:

  • возможных состояний, десятичный разряд = 1 децит;
  • возможных состояний, десятичных разряда = 1 килодецит;
  • возможных состояний, десятичных разрядов = 1 мегадецит;
  • возможных состояний, десятичных разрядов = 1 гигадецит.

Единица, соответствующая числу 10 — децит — равна log210 ≈ 3,322 бита.

В проводной технике связи (телеграф и телефон) и радио исторически впервые единица информации получила обозначение бод.

Единицы, производные от бита

[править | править код]

В целых количествах двоичных разрядов (битов) количество возможных состояний равно степеням двойки.

Тетрада, полубайт, ниббл

[править | править код]

Особое название имеют четыре двоичных разряда (4 бита) — тетрада, полубайт, ниббл, — которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Измерения в байтах
ГОСТ 8.417—2002 Приставки СИ Приставки МЭК
Название Обозначение Степень Название Степень Название Обозначение Степень
байт Б 100 100 байт B Б 20
килобайт Кбайт 103 кило- 103 кибибайт KiB КиБ 210
мегабайт Мбайт 106 мега- 106 мебибайт MiB МиБ 220
гигабайт Гбайт 109 гига- 109 гибибайт GiB ГиБ 230
терабайт Тбайт 1012 тера- 1012 тебибайт TiB ТиБ 240
петабайт Пбайт 1015 пета- 1015 пебибайт PiB ПиБ 250
эксабайт Эбайт 1018 экса- 1018 эксбибайт EiB ЭиБ 260
зеттабайт Збайт 1021 зетта- 1021 зебибайт ZiB ЗиБ 270
йоттабайт Ибайт 1024 йотта- 1024 йобибайт YiB ЙиБ 280
роннабайт - 1027 ронна- 1027 - - - -
кветтабайт - 1030 кветта- 1030 - - - -

Байт (Б[2]) — единицая информации, состоящая из 8 бит. Байт для конкретного устройства определяется как минимальный шаг адресации памяти. К байту (не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в мире компьютерных технологий. Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.

Для измерения ёмкостей запоминающих устройств и объёмов информации, составляющих сотни и тысячи байтов, служат единицы:

  • килобайт (Кбайт, КБ), равный 1000 Б;
  • кибибайт (КиБ), равный 1024 Б[2] (о путанице десятичных и двоичных единиц и терминов см. ниже).

Такой порядок величин имеют, например:

  • сектор диска, который обычно равен 512 Б (для некоторых устройств может быть равен 1 или 2 КБ);
  • классический размер «блока» в файловых системах UNIX равен 1 КБ (1024 Б);
  • «страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 Б (4 КБ);
  • объём информации на дискете 3,5″ равен 1440 КБ.

1 мегабайт (Мбайт, МБ) равен 1000 КБ, или 1 000 000 Б.

1 мебибайт (МиБ) равен 1024 КБ, или 1 048 576 Б.

Например, объём адресного пространства процессора Intel 8086 равен 1 МБ.

Объём оперативной памяти и ёмкость CD-ROM традиционно измеряют двоичными единицами — мебибайтами и гибибайтами (хотя эти термины и не используют), а для объёма жестких дисков используют десятичные мегабайты (а также гигабайты и терабайты).

1 гигабайт (Гбайт, ГБ) равен 1000 МБ, или 1 000 000 КБ, или 1 000 000 000 Б.

1 гибибайт (ГиБ) равен 1024 МБ, или 1 048 576 КБ, или 1 073 741 824 Б.

Гигабайтами измеряют объём жёстких дисков, DVD- и Blu-ray-носителей, а также носителей на флеш-памяти. Разница между двоичной и десятичной единицами при исчислении их объёмов уже превышает 7 %.

1 гигабайт (Тбайт, ТБ) равен 1000 ГБ, или 1 000 000 МБ, или 1 000 000 000 КБ, или 1 000 000 000 000 Б.

1 тебибайт (ТиБ) равен 1024 ГБ, или 1 048 576 МБ, или 1 073 741 824 КБ, или 1 099 511 627 776 Б.

Терминологические проблемы

[править | править код]

Во избежание недоразумений следует разделять:

  • двоичные кратные единицы (2 в степенях, кратных 10) — собственно Кбайт, Мбайт, Гбайт и т. д.;
  • десятичные крактные единицы (10 в степенях, кратных 3).

В качестве терминов для второго варианта МЭК и российские стандарты[2] предлагают использовать названия «кибибайт», «мебибайт», «гибибайт» и т. д. Эти термины не получили широкого распространения и практически не используются.

Примечания

[править | править код]
  1. 1 2 Еременко В. Т., Минаев В. А. и др. 2.5. Количественная оценка информации // Теория информации. — Орёл: ОрёлГТУ, 2010. — С. 74. — 443 с. — ISBN 978-5-93932-311-6.
  2. 1 2 3 4 ГОСТ 8.417-2024 «Государственная система обеспечения единства измерений. Единицы величин».
  3. «Логарифм» на answers.com Архивная копия от 22 сентября 2008 на Wayback Machine (англ.)
  4. С точки зрения физики, величина информации (как и близкая к ней по смыслу энтропия) безразмерна. На практике, как и при измерении безразмерных углов, пользуются различными практически удобными единицами.