Единицы измерения информации что это такое
Единицы измерения информации
Содержание
Мы с вами уже так много говорим о компьютере, программах и их характеристиках, возможных действиях и их последствиях, о файлах и папках, а также многом другом. Вы знаете, что информация записывается на жесткий диск. Она хранится в виде файлов. Но сколько таких файлов сможет вместить Ваш винчестер?
Как узнать ответ на этот вопрос, если не знать, в чем же измеряется информация?
Ответ на этот вопрос Вы узнаете сегодня, если прочитаете данный опус.
Минимальная единица информации — бит
Начнем с малого. Единицы измерения информации ранжируются точно так же, как, к примеру, единицы массы или расстояния. Но если в 1 килограмме 1000 граммов, а в 1 метре 1000 миллиметров, то с измерением информации все немного иначе, хотя принцип и остается тот же.
Чтобы было проще понимать, что такое байт или что такое бит, сперва разберемся с некоторыми основами цифровой информации, то есть той, что хранится и обрабатывается на Вашем компьютере.
Почему цифровая? Сейчас объясню.
Вы можете передавать свои знания и какие-то новости посредством устной речи. Она ведь состоит из гласных и согласных какого-то языка, в нашем случае русского. Компьютер не умеет разговаривать, но и он должен передавать, получать и обрабатывать информацию. Так вот он делает это посредством набора единичек и нолей — двоичного кода. Вся информация, с которой работает Ваш компьютер, выглядит для него примерно вот так: 01 или 0110, или 010110101010. Разумеется, чем больше файл, тем длиннее и эта запись. Кстати, повторите урок о том, что такое файл. По сути, она просто может быть очень длинной, но не бесконечной. Именно поэтому данный вид информации и называется цифровым, т.е. последовательностью единичек и нулей. Замечу, что компьютер может понять только такой язык.
Самой маленькой величиной является бит (анг. BInary digiT – двоичная цифра). Это простейшая величина, которая может хранить лишь одно значение — либо «ноль», либо «единицу». Вот Вам строгое определение того, что такое бит:
Бит — это один двоичный разряд, принимающий одно из двух значений – «0» или «1».
Другими словами, бит – это небольшая емкость, которая хранит в себе самый маленький запас информации.
Не пытайтесь заучивать определение, просто поймите, насколько это мало. Для сравнения, обычная буква в текстовом редакторе для компьютера является набором из 8-ми нолей и единиц, т.е. 8-ми бит.
Для развития Вашей эрудиции скажу, что 0 и 1 — это как «да» (есть сигнал) и «нет» (нет сигнала) для компьютера. Другими словами, это равноценные значения.
Что такое байт
Думаю, все понимают, что измерять всю информацию на винчестере в битах будет очень и очень неудобно. Это все равно, что измерять массу солнца в граммах. Поэтому Вам придется познакомиться с новой величиной и узнать, что такое байт.
Один байт равен восьми бит. Именно восьми, а не десяти, как можно было бы подумать, разумно проводя аналогию с другими единицами измерения. Различных комбинаций ноликов и единичек в одном байте может быть превеликое множество (а точнее – «2» в 8 степени, т.е. 256 вариантов), но этого нам знать совершенно не обязательно. Просто запомним, 1 байт = 8 бит.
Обозначается байт прописной русской буквой «Б».
Производные от «бит»
Прежде, чем рассказать Вам, что такое килобайт, мегабайт, гигабайт и терабайт, упомяну, что существуют и такие единицы, как килобит, мегабит, гигабит и терабит. Вот формулы перевода одних единиц в другие (жирным шрифтом выделено обозначение величины):
1 килобит (Кбит) = 1024 бит («2» в 10 степени бит)
1 мегабит (Мбит) = 1024 килобит («2» в 10 степени килобит)
1 гигабит (Гбит) = 1024 мегабит («2» в 10 степени мегабит)
1 терабит (Тбит) = 1024 гигабит («2» в 10 степени гигабит)
Необычно, правда? Вспомните, что бит — это кодировка из двух цифр. Поэтому все последующие единицы представляют собой кодировку из количества цифр, равную двум в какой-либо степени (зависит от конкретной единицы измерения). Отсюда и такое некруглое значение.
Производные от «байт»
Но исчислять информацию в БИТАХ неудобно, как правило, все применяют «БАЙТЫ». Чаще всего самой популярной единицей измерения количества информации на Вашем компьютере является мегабайт. Если Вы наведете мышкой на любую папку с достаточным количеством информации, то всплывет маленькое пояснительное окошко, где будет указан объем этой папки. Вот таблица перевода одних единиц в другие (жирным шрифтом выделено обозначение величины):
1 килобайт (КБ) = 1024 байт («2» в 10 степени байт)
1 мегабайт (МБ) = 1024 килобайт («2» в 10 степени килобайт)
1 гигабайт (ГБ) = 1024 мегабайт («2» в 10 степени мегабайт)
1 терабайт (ТБ) = 1024 гигабайт («2» в 10 степени гигабайт)
Как видно, все аналогично битам.
Объем различных типов файлов
Уверен, многих интересует, как узнать, сколько же информации способен вместить именно Ваш компьютер, а точнее винчестер или жесткий диск. Кстати почитайте перед этим про локальные диски. Я Вас научу самому простому способу это сделать.
Откройте «Мой компьютер». Видите свои локальные диски? Единицы измерения информации, использующиеся для показа количества информации на локальных дисках у всех, как правило, одинаковы. Это гигабайты. Что такое гигабайт мы уже знаем, так что перейдем к подсчету свободного и занятого места на жестком диске. Под каждым диском есть специальное уведомление, где показано, сколько свободного места осталось и сколько всего информации диск может вместить.
Теперь приведу некоторые примеры файлов и их возможные объемы. Это поможет Вам ориентироваться в том, что Вы сможете записать на локальный диск, а что туда уже не влезет. Заметьте, один локальный диск НЕ МОЖЕТ задействовать место другого. Это значит, что файл целиком и полностью должен находиться на одном локальном диске. Есть, правда, специальные программы, позволяющие работать с локальными дисками, но об этом мы будем говорить в другой раз, так как тема сложная и достаточно объемная.
Кстати, различные типы файлов вы можете найти на своем рабочем столе.
Любите слушать музыку? Тогда Вам просто необходимо знать, что один музыкальный трек занимает до нескольких мегабайт объема памяти (в среднем, от 3 до 7). Попробуйте самостоятельно подсчитать, сколько таких мелодий вместит Ваш локальный диск, если на нем есть 1 гигабайт свободного места.
А как на счет того, чтобы посмотреть хороший фильм? Их объем, в зависимости от качества записи и длины трека, может занимать от 700 мегабайт до 1,5 гигабайта.
Для общего развития добавлю, что современные полноформатные игры могут занимать до нескольких десятков гигабайт. Не всякий локальный диск может выдержать такое.
Единицы измерения информации путать не стоит. Четко обращайте внимание на то, сколько места есть и сколько необходимо записать.
Современные жесткие диски могут содержать информацию объемом несколько терабайт. Что очень актуально, ведь качество игр, фильмов и даже музыки растет, что требует постоянного увеличения их информационного объема.
Теперь Вы знаете, что такое байты какие бывают производные от него. Вам известны рамки объема Ваших локальных дисков, а значит, Вы стали лучше понимать работу компьютера.
Измерение информации
В нашей жизни каждый из нас что-то измеряет. Например, в детстве, наши родители измеряли нам высоту нашего тела. Это ведь так увлекательно, когда узнаешь, что всего за один год ты вырос на целых 5 сантиметров! Для этих целей мы использовали линейку и дверной косяк, помечая на нём ежегодно зарубками высоту.
Каждое измерение требует своего прибора и своей единицы измерения.
Так, масса какого-либо тела измеряется весами в килограммах, время при помощи часов в секундах и т.д.
У начинающих изучать информатику, сам собой, возникает вопрос о том, в каких единицах измерять информацию?
Наименьшая единица измерения информации
Для измерения информации в информатике используют свою, особенную единицу измерения. Она получила название — «бит» и образована от словосочетания двух английских слов — «binary digit».
Для того чтобы была возможность измерить информацию необходимо, как вы помните, закодировать информацию в цифровые двоичные данные. Только так, мы сможем узнать размер набора цифровых данных, хранящемся в каком-либо файле.
Это определение означает, что не существует никакой другой единицы измерения информации, которая была бы меньше, по своему значению, чем один бит.
Один бит содержит в себе очень малую часть информации. Ведь он способен принимать только одно из двух определенных значений (1 или 0).
Поэтому, измерять информацию, используя лишь одни биты, крайне неудобно — числа выходят очень большими. Это тоже самое, если бы мы измеряли высоту своего тела в миллиметрах.
Например, для кодирования 1 символа в текст достаточно 8 бит. 8 бит называют байтом.
Крупные единицы измерения информации
В связи с этим, в информатике были придуманы более крупные единицы измерения информации, связь между которыми отражена ниже:
Существуют и более крупные единицы информации:
Приведем примеры для сравнения разных объёмов оцифрованной текстовой информации.
Один байт занимает символ, введённый нами с клавиатуры.
100 Кбайт занимает снимок в телефоне с низким разрешением.
1 Мбайт — небольшая художественная книга.
Три гигабайт всего лишь 1 час видеозаписи в хорошем качестве.
Один гигабайт текста способен прочитать человек за всю свою жизнь.
Информационный объём текстового сообщения
Как найти, к примеру, информационный объём сообщения «Информатика – главная наука современности».
Для этого нужно сосчитать общее количество символов в сообщении (заключено в кавычках), учитывая пробелы между словами (пробел в компьютере тоже символ). Итого, получаем 41 символов или 41 байт.
Предлагаем узнать, сколько информации находится в книге из 100 страниц, если на каждой странице умещается 50 строк, а на каждой строке — 60 символов.
100⋅50⋅60=300 000 символов, что составляет 300 000 байт. Переведём всё в килобайты: 300 000 байт /1024=292,97 Кб. В мегабайтах это будет уже 292,97 Кб /1024=0,29 Мб.
Информационный объём мультимедийной информации
Гораздо больше информации включают в себя файлы графических изображений, а ещё больше — видеофайлы.
Мультимедийной информацией называют данные, которые содержат рисунки, фотографии, звук и видео.
К примеру, растровый рисунок, состоит из 1000 на 1000 пикселей.
Каждый пиксель может быть закодирован 24 битами или 3 байтами (так как 24/8=3) и занимает информационный объём равный 1000⋅1000⋅3=3 000 000 байт.
В связи с этим, промышленность выпускает большие по объему носители цифровых данных.
Объём современных цифровых носителей (жёстких или твердотельных дисков), уже достигает объёма нескольких терабайт.
Единицы измерения информации что это такое
1.1. Понятие информации. Количество информации. Единицы измерения информации
Информация является одним из фундаментальных понятий современной науки наряду с такими понятиями, как «вещество» и «энергия».
Например, если мы подбрасываем вверх монету, то она может упасть двумя различными способами (орлом вверх или решкой вверх). Соответственно, у данного события два возможных исхода. Если же подбрасывать игральный кубик, то исходов будет шесть.
После таких определений понятия «информация» можно говорить об её измерении. Введём несколько основных единиц измерения информации.
Для каждой основной единицы измерения информации существуют производные более крупные единицы измерения. Поскольку чаще всего мы будем использовать в качестве основной единицы бит, рассмотрим производны е единиц ы измерения для бита. На практике чаще всего используется не бит, а байт.
Далее существует две линейки производных единиц для байта – линейка десятичных приставок и линейка двоичных приставок. В случае десятичных приставок каждая следующая единица измерения равна `1000` предыдущих единиц. Обозначаются десятичные приставки латинскими буквами (буква префикса из системы СИ и заглавная «B», обозначающая «байт») Итак:
`1` килобайт (`1` kB) `= 1000` B (1000 байт);
`1` мегабайт (`1` MB) `= 1000` kB ;
`1` гигабайт (`1` GB) `= 1000` MB;
`1` терабайт (`1` TB) `= 1000` GB;
`1` петабайт (`1` PB) `= 1000` TB;
`1` эксабайт (`1` EB) `= 1000` PB;
`1` зеттабайт (`1` ZB) `= 1000` EB;
`1` йоттабайт(`1` YB) `= 1000` ZB.
Более крупных единиц на настоящий момент не введено.
При использовании двоичных приставок, каждая следующая едини-ца измерения равна 1024 предыдущих единиц. В России принято обозначать двоичные приставки, записывая префикс заглавной русской буквой и после него слово «байт» целиком и тоже русскими буквами. За рубежом для обозначения двоичных приставок между префиксом и «B» добавляется маленькая буква «i» (от слова «binary»). Кроме того, все префиксы записываются заглавными буквами. Итак:
`1` кибибайт (`1` Кбайт, `1` KiB) `=2^10` байт `= 1024` байт;
`1` мебибайт (`1` Мбайт, `1` MiB) `=2^20` байт `= 1024` Кбайт;
1 гибибайт (`1` Гбайт, `1` GiB) `=2^30` байт `= 1024` Мбайт;
1 тебибайт (`1` Тбайт, `1` TiB) `=2^40` байт `= 1024` Гбайт;
1 пебибайт (`1` Пбайт, `1` PiB) `=2^50` байт `= 1024` Тбайт;
1 эксбибайт (`1` Эбайт, `1`EiB) `=2^60` байт `= 1024` Пбайт;
1 зебибайт (`1` Збайт, `1` ZiB) `=2^70` байт `= 1024` Эбайт;
1 йобибайт (`1` Йбайт, `1` YiB) `=2^80` байт `= 1024` Збайт.
Единицы измерения информации что это такое
Измерение информации: содержательный и алфавитный подходы. Единицы измерения информации.
Вопрос: «Как измерить информацию?» очень непростой. Ответ на него зависит от того, что понимать под информацией. Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными.
Содержательный подход к измерению информации.
Для человека информация — это знания человека. Рассмотрим вопрос с этой точки зрения.
Получение новой информации приводит к расширению знаний. Если некоторое сообщение приводит к уменьшению неопределенности нашего знания, то можно говорить, что такое сообщение содержит информацию.
Отсюда следует вывод, что сообщение информативно (т.е. содержит ненулевую информацию), если оно пополняет знания человека. Например, прогноз погоды на завтра — информативное сообщение, а сообщение о вчерашней погоде неинформативно, т.к. нам это уже известно.
Нетрудно понять, что информативность одного и того же сообщения может быть разной для разных людей. Например: «2×2=4» информативно для первоклассника, изучающего таблицу умножения, и неинформативно для старшеклассника.
Но для того чтобы сообщение было информативно оно должно еще быть понятно. Быть понятным, значит быть логически связанным с предыдущими знаниями человека. Определение «значение определенного интеграла равно разности значений первообразной подынтегральной функции на верхнем и на нижнем пределах», скорее всего, не пополнит знания и старшеклассника, т.к. оно ему не понятно. Для того, чтобы понять данное определение, нужно закончить изучение элементарной математики и знать начала высшей.
Получение всяких знаний должно идти от простого к сложному. И тогда каждое новое сообщение будет в то же время понятным, а значит, будет нести информацию для человека.
Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными.
Алфавитный подход к измерению информации.
Один символ алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт.
Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.
В любой системе единиц измерения существуют основные единицы и производные от них.
Для измерения больших объемов информации используются следующие производные от байта единицы:
Методы измерения количества информации
Теория к заданию 10 из ЕГЭ по информатике
Информация и ее кодирование
Различные подходы к определению понятия «информация». Виды информационных процессов. Информационный аспект в деятельности человека
Информация (лат. informatio — разъяснение, изложение, набор сведений) — базовое понятие в информатике, которому нельзя дать строгого определения, а можно только пояснить:
Понятие «информация» является общенаучным, т. е. используется в различных науках: физике, биологии, кибернетике, информатике и др. При этом в каждой науке данное понятие связано с различными системами понятий. Так, в физике информация рассматривается как антиэнтропия (мера упорядоченности и сложности системы). В биологии понятие «информация» связывается с целесообразным поведением живых организмов, а также с исследованиями механизмов наследственности. В кибернетике понятие «информация» связано с процессами управления в сложных системах.
Основными социально значимыми свойствами информации являются:
В человеческом обществе непрерывно протекают информационные процессы: люди воспринимают информацию из окружающего мира с помощью органов чувств, осмысливают ее и принимают определенные решения, которые, воплощаясь в реальные действия, воздействуют на окружающий мир.
Информационный процесс — это процесс сбора (приема), передачи (обмена), хранения, обработки (преобразования) информации.
Сбор информации — это процесс поиска и отбора необходимых сообщений из разных источников (работа со специальной литературой, справочниками; проведение экспериментов; наблюдения; опрос, анкетирование; поиск в информационно-справочных сетях и системах и т. д.).
Передача информации — это процесс перемещения сообщений от источника к приемнику по каналу передачи. Информация передается в форме сигналов — звуковых, световых, ультразвуковых, электрических, текстовых, графических и др. Каналами передачи могут быть воздушное пространство, электрические и оптоволоконные кабели, отдельные люди, нервные клетки человека и т. д.
Хранение информации — это процесс фиксирования сообщений на материальном носителе. Сейчас для хранения информации используются бумага, деревянные, тканевые, металлические и другие поверхности, кино- и фотопленки, магнитные ленты, магнитные и лазерные диски, флэш-карты и др.
Обработка информации — это процесс получения новых сообщений из имеющихся. Обработка информации является одним из основных способов увеличения ее количества. В результате обработки из сообщения одного вида можно получить сообщения других видов.
Защита информации — это процесс создания условий, которые не допускают случайной потери, повреждения, изменения информации или несанкционированного доступа к ней. Способами защиты информации являются создание ее резервных копий, хранение в защищенном помещении, предоставление пользователям соответствующих прав доступа к информации, шифрование сообщений и др.
Язык как способ представления и передачи информации
Для того чтобы сохранить информацию и передать ее, с давних времен использовались знаки.
В зависимости от способа восприятия знаки делятся на:
Для долговременного хранения знаки записывают на носители информации.
Для передачи информации используются знаки в виде сигналов (световые сигналы светофора, звуковой сигнал школьного звонка и т. д.).
По способу связи между формой и значением знаки делятся на:
Для представления информации используются знаковые системы, которые называются языками. Основу любого языка составляет алфавит — набор символов, из которых формируется сообщение, и набор правил выполнения операций над символами.
Системы счисления также можно рассматривать как формальные языки. Так, десятичная система счисления — это язык, алфавит которого состоит из десяти цифр 0..9, двоичная система счисления — язык, алфавит которого состоит из двух цифр — 0 и 1.
Методы измерения количества информации: вероятностный и алфавитный
Единицей измерения количества информации является бит. 1 бит — это количество информации, содержащейся в сообщении, которое вдвое уменьшает неопределенность знаний о чем-либо.
Связь между количеством возможных событий N и количеством информации I определяется формулой Хартли:
При алфавитном подходе к определению количества информации отвлекаются от содержания (смысла) информации и рассматривают ее как последовательность знаков определенной знаковой системы. Набор символов языка (алфавит) можно рассматривать как различные возможные события. Тогда, если считать, что появление символов в сообщении равновероятно, по формуле Хартли можно рассчитать, какое количество информации несет каждый символ:
Например, в русском языке 32 буквы (буква ё обычно не используется), т. е. количество событий будет равно 32. Тогда информационный объем одного символа будет равен:
I = log2 32 = 5 битов.
Если N не является целой степенью 2, то число log2N не является целым числом, и для I надо выполнять округление в большую сторону. При решении задач в таком случае I можно найти как log2N’, где N′ — ближайшая к N степень двойки — такая, что N′ > N.
Например, в английском языке 26 букв. Информационный объем одного символа можно найти так:
N = 26; N’ = 32; I = log2N’ = log2(2 5 ) = 5 битов.
Если количество символов алфавита равно N, а количество символов в записи сообщения равно М, то информационный объем данного сообщения вычисляется по формуле:
Примеры решения задач
Пример 1. Световое табло состоит из лампочек, каждая из которых может находиться в одном из двух состояний («включено» или «выключено»). Какое наименьшее количество лампочек должно находиться на табло, чтобы с его помощью можно было передать 50 различных сигналов?
Пример 2. Метеорологическая станция ведет наблюдения за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100, которое записывается при помощи минимально возможного количества битов. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.
Решение. В данном случае алфавитом является множество целых чисел от 0 до 100. Всего таких значений 101. Поэтому информационный объем результатов одного измерения I = log2101. Это значение не будет целочисленным. Заменим число 101 ближайшей к нему степенью двойки, большей 101. Это число 128 = 27. Принимаем для одного измерения I = log2128 = 7 битов. Для 80 измерений общий информационный объем равен:
80 · 7 = 560 битов = 70 байтов.
Вероятностный подход к измерению количества информации применяют, когда возможные события имеют различные вероятности реализации. В этом случае количество информации определяют по формуле Шеннона:
$N$ — количество возможных событий;
Например, пусть при бросании несимметричной четырехгранной пирамидки вероятности отдельных событий будут равны:
Тогда количество информации, которое будет получено после реализации одного из них, можно вычислить по формуле Шеннона:
Единицы измерения количества информации
Наименьшей единицей информации является бит (англ. binary digit (bit) — двоичная единица информации).
Бит — это количество информации, необходимое для однозначного определения одного из двух равновероятных событий. Например, один бит информации получает человек, когда он узнает, опаздывает с прибытием нужный ему поезд или нет, был ночью мороз или нет, присутствует на лекции студент Иванов или нет и т. д.
В информатике принято рассматривать последовательности длиной 8 битов. Такая последовательность называется байтом.
Производные единицы измерения количества информации:
1 килобайт (Кб) = 1024 байта = 2 10 байтов
1 мегабайт (Мб) = 1024 килобайта = 2 20 байтов
1 гигабайт (Гб) = 1024 мегабайта = 2 30 байтов
1 терабайт (Тб) = 1024 гигабайта = 2 40 байтов
Процесс передачи информации. Виды и свойства источников и приемников информации. Сигнал, кодирование и декодирование, причины искажения информации при передаче
Информация передается в виде сообщений от некоторого источника информации к ее приемнику посредством канала связи между ними.
В качестве источника информации может выступать живое существо или техническое устройство. Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал.
Сигнал — это материально-энергетическая форма представления информации. Другими словами, сигнал — это переносчик информации, один или несколько параметров которого, изменяясь, отображают сообщение. Сигналы могут быть аналоговыми (непрерывными) или дискретными (импульсными).
Сигнал посылается по каналу связи. В результате в приемнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением.
Передача информации по каналам связи часто сопровождается воздействием помех, вызывающих искажение и потерю информации.
Примеры решения задач
Пример 1. Для кодирования букв А, З, Р, О используются двухразрядные двоичные числа 00, 01, 10, 11 соответственно. Этим способом закодировали слово РОЗА и результат записали шестнадцатеричным кодом. Указать полученное число.
Решение. Запишем последовательность кодов для каждого символа слова РОЗА: 10 11 01 00. Если рассматривать полученную последовательность как двоичное число, то в шестнадцатеричном коде оно будет равно: 1011 01002 = В416.
Скорость передачи информации и пропускная способность канала связи
Прием/передача информации может происходить с разной скоростью. Количество информации, передаваемое за единицу времени, есть скорость передачи информации, или скорость информационного потока.
Скорость выражается в битах в секунду (бит/с) и кратных им Кбит/с и Мбит/с, а также в байтах в секунду (байт/с) и кратных им Кбайт/с и Мбайт/с.
Максимальная скорость передачи информации по каналу связи называется пропускной способностью канала.
Примеры решения задач
Пример 1. Скорость передачи данных через ADSL-соединение равна 256000 бит/с. Передача файла через данное соединение заняла 3 мин. Определите размер файла в килобайтах.
Решение. Размер файла можно вычислить, если умножить скорость передачи информации на время передачи. Выразим время в секундах: 3 мин = 3 ⋅ 60 = 180 с. Выразим скорость в килобайтах в секунду: 256000 бит/с = 256000 : 8 : 1024 Кбайт/с. При вычислении размера файла для упрощения расчетов выделим степени двойки:
Размер файла = (256000 : 8 : 1024) ⋅ (3 ⋅ 60) = (2 8 ⋅ 10 3 : 2 3 : 2 10 ) ⋅ (3 ⋅ 15 ⋅ 2 2 ) = (2 8 ⋅ 125 ⋅ 2 3 : 2 3 : 2 10 ) ⋅ (3 ⋅ 15 ⋅ 2 2 ) = 125 ⋅ 45 = 5625 Кбайт.
Представление числовой информации. Сложение и умножение в разных системах счисления
Представление числовой информации с помощью систем счисления
Для представления информации в компьютере используется двоичный код, алфавит которого состоит из двух цифр — 0 и 1. Каждая цифра машинного двоичного кода несет количество информации, равное одному биту.
Система счисления — это система записи чисел с помощью определенного набора цифр.
Система счисления называется позиционной, если одна и та же цифра имеет различное значение, которое определяется ее местом в числе.
Позиционной является десятичная система счисления. Например, в числе 999 цифра «9» в зависимости от позиции означает 9, 90, 900.
Римская система счисления является непозиционной. Например, значение цифры Х в числе ХХІ остается неизменным при вариации ее положения в числе.
Позиция цифры в числе называется разрядом. Разряд числа возрастает справа налево, от младших разрядов к старшим.
Количество различных цифр, употребляемых в позиционной системе счисления, называется ее основанием.
Развернутая форма числа — это запись, которая представляет собой сумму произведений цифр числа на значение позиций.
Развернутая форма записи чисел произвольной системы счисления имеет вид
$a$ — цифры численной записи, соответствующие разрядам;
$m$ — количество разрядов числа дробной части;
$n$ — количество разрядов числа целой части;
$q$ — основание системы счисления.
Если основание используемой системы счисления больше десяти, то для цифр вводят условное обозначение со скобкой вверху или буквенное обозначение: В — двоичная система, О — восмеричная, Н — шестнадцатиричная.
Например, если в двенадцатеричной системе счисления 10 = А, а 11 = В, то число 7А,5В12 можно расписать так:
В шестнадцатеричной системе счисления 16 цифр, обозначаемых 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F, что соответствует следующим числам десятеричной системы счисления: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15. Примеры чисел: 17D,ECH; F12AH.
Перевод чисел в позиционных системах счисления
Перевод чисел из произвольной системы счисления в десятичную
Для перевода числа из любой позиционной системы счисления в десятичную необходимо использовать развернутую форму числа, заменяя, если это необходимо, буквенные обозначения соответствующими цифрами. Например:
11012 = 1 ⋅ 2 3 + 1 ⋅ 2 2 + 0 ⋅ 2 1 + 1 ⋅ 2 0 = 1310;
17D,ECH = 12 ⋅ 16 –2 + 14 ⋅ 16 –1 + 13 ⋅ 160 + 7 ⋅ 16 1 + 1 ⋅ 16 2 = 381,921875.
Перевод чисел из десятичной системы счисления в заданную
Для преобразования целого числа десятичной системы счисления в число любой другой системы счисления последовательно выполняют деление нацело на основание системы счисления, пока не получат нуль. Числа, которые возникают как остаток от деления на основание системы, представляют собой последовательную запись разрядов числа в выбранной системе счисления от младшего разряда к старшему. Поэтому для записи самого числа остатки от деления записывают в обратном порядке.
Например, переведем десятичное число 475 в двоичную систему счисления. Для этого будем последовательно выполнять деление нацело на основание новой системы счисления, т. е. на 2:
Читая остатки от деления снизу вверх, получим 111011011.
1 ⋅ 2 8 + 1 ⋅ 2 7 + 1 ⋅ 2 6 + 0 ⋅ 2 5 + 1 ⋅ 2 4 + 1 ⋅ 2 3 + 0 ⋅ 2 2 + 1 ⋅ 2 1 + 1 ⋅ 2 0 = 1 + 2 + 8 + 16 + 64 + 128 + 256 = 47510.
Для преобразования десятичных дробей в число любой системы счисления последовательно выполняют умножение на основание системы счисления, пока дробная часть произведения не будет равна нулю. Полученные целые части являются разрядами числа в новой системе, и их необходимо представлять цифрами этой новой системы счисления. Целые части в дальнейшем отбрасываются.
Например, переведем десятичную дробь 0,37510 в двоичную систему счисления:
Полученный результат — 0,0112.
Не каждое число может быть точно выражено в новой системе счисления, поэтому иногда вычисляют только требуемое количество разрядов дробной части.
Перевод чисел из двоичной системы счисления в восьмеричную и шестнадцатеричную и обратно
Для записи восьмеричных чисел используются восемь цифр, т. е. в каждом разряде числа возможны 8 вариантов записи. Каждый разряд восьмеричного числа содержит 3 бита информации (8 = 2 І ; І = 3).
Таким образом, чтобы из восьмеричной системы счисления перевести число в двоичный код, необходимо каждую цифру этого числа представить триадой двоичных символов. Лишние нули в старших разрядах отбрасываются.
1234,7778 = 001 010 011 100,111 111 1112 = 1 010 011 100,111 111 1112;
12345678 = 001 010 011 100 101 110 1112 = 1 010 011 100 101 110 1112.
При переводе двоичного числа в восьмеричную систему счисления нужно каждую триаду двоичных цифр заменить восьмеричной цифрой. При этом, если необходимо, число выравнивается путем дописывания нулей перед целой частью или после дробной.
Для записи шестнадцатеричных чисел используются шестнадцать цифр, т. е. для каждого разряда числа возможны 16 вариантов записи. Каждый разряд шестнадцатеричного числа содержит 4 бита информации (16 = 2 І ; І = 4).
Таким образом, для перевода двоичного числа в шестнадцатеричное его нужно разбить на группы по четыре цифры и преобразовать каждую группу в шестнадцатеричную цифру.
Для перевода шестнадцатеричного числа в двоичный код необходимо каждую цифру этого числа представить четверкой двоичных цифр.
1234,AB7716 = 0001 0010 0011 0100,1010 1011 0111 01112 = 1 0010 0011 0100,1010 1011 0111 01112;
CE456716 = 1100 1110 0100 0101 0110 01112.
При переводе числа из одной произвольной системы счисления в другую нужно выполнить промежуточное преобразование в десятичное число. При переходе из восьмеричного счисления в шестнадцатеричное и обратно используется вспомогательный двоичный код числа.
Например, переведем троичное число 2113 в семеричную систему счисления. Для этого сначала преобразуем число 2113 в десятичное, записав его развернутую форму:
2113 = 2 ⋅ 3 2 + 1 ⋅ 3 1 + 1 ⋅ 3 0 = 18 + 3 + 1 = 2210.
Затем переведем десятичное число 2210 в семеричную систему счисления делением нацело на основание новой системы счисления, т. е. на 7:
Примеры решения задач
Пример 1. В системе счисления с некоторым основанием число 12 записывается в виде 110. Указать это основание.
Пример 2. Указать через запятую в порядке возрастания все основания систем счисления, в которых запись числа 22 оканчивается на 4.
Пример 3. Указать через запятую в порядке возрастания все числа, не превосходящие 25, запись которых в двоичной системе счисления оканчивается на 101. Ответ записать в десятичной системе счисления.
a1 = 0; x = 5 + 0 · 8 = 5;.
a1=1; x = 5 + 1 · 8 = 13;.
a1 = 2; x = 5 + 2 · 8 = 21;.
Арифметические операции в позиционных системах счисления
Правила выполнения арифметических действий над двоичными числами задаются таблицами сложения, вычитания и умножения.
Сложение | Вычитание | Умножение |
0 + 0 = 0 | 0 – 0 = 0 | 0 ⋅ 0 = 0 |
0 + 1 = 1 | 1 – 0 = 1 | 0 ⋅ 1 = 0 |
1 + 0 = 1 | 1 – 1 = 0 | 1 ⋅ 0 = 0 |
1 + 1 = 10 | 10 – 1 = 1 | 1 ⋅ 1 = 1 |
Правило выполнения операции сложения одинаково для всех систем счисления: если сумма складываемых цифр больше или равна основанию системы счисления, то единица переносится в следующий слева разряд. При вычитании, если необходимо, делают заем.
Пример выполнения сложения: сложим двоичные числа 111 и 101, 10101 и 1111:
Пример выполнения вычитания: вычтем двоичные числа 10001 – 101 и 11011 – 1101:
Пример выполнения умножения: умножим двоичные числа 110 и 11, 111 и 101:
Аналогично выполняются арифметические действия в восьмеричной, шестнадцатеричной и других системах счисления. При этом необходимо учитывать, что величина переноса в следующий разряд при сложении и заем из старшего разряда при вычитании определяется величиной основания системы счисления.
Например, выполним сложение восьмеричных чисел 368 и 158, а также вычитание шестнадцатеричных чисел 9С16 и 6716:
При выполнении арифметических операций над числами, представленными в разных системах счисления, нужно предварительно перевести их в одну и ту же систему.
Представление чисел в компьютере
Формат с фиксированной запятой
В памяти компьютера целые числа хранятся в формате с фиксированной запятой: каждому разряду ячейки памяти соответствует один и тот же разряд числа, «запятая» находится вне разрядной сетки.
Для хранения целых неотрицательных чисел отводится 8 битов памяти. Минимальное число соответствует восьми нулям, хранящимся в восьми битах ячейки памяти, и равно 0. Максимальное число соответствует восьми единицам и равно
1 ⋅ 2 7 + 1 ⋅ 2 6 + 1 ⋅ 2 5 + 1 ⋅ 2 4 + 1 ⋅ 2 3 + 1 ⋅ 2 2 + 1 ⋅ 2 1 + 1 ⋅ 2 0 = 25510.
Таким образом, диапазон изменения целых неотрицательных чисел — от 0 до 255.
Для п-разрядного представления диапазон будет составлять от 0 до 2 n – 1.
Для хранения целых чисел со знаком отводится 2 байта памяти (16 битов). Старший разряд отводится под знак числа: если число положительное, то в знаковый разряд записывается 0, если число отрицательное — 1. Такое представление чисел в компьютере называется прямым кодом.
Для представления отрицательных чисел используется дополнительный код. Он позволяет заменить арифметическую операцию вычитания операцией сложения, что существенно упрощает работу процессора и увеличивает его быстродействие. Дополнительный код отрицательного числа А, хранящегося в п ячейках, равен 2 n − |А|.
Алгоритм получения дополнительного кода отрицательного числа:
1. Записать прямой код числа в п двоичных разрядах.
2. Получить обратный код числа. (Обратный код образуется из прямого кода заменой нулей единицами, а единиц — нулями, кроме цифр знакового разряда. Для положительных чисел обратный код совпадает с прямым. Используется как промежуточное звено для получения дополнительного кода.)
3. Прибавить единицу к полученному обратному коду.
Например, получим дополнительный код числа –201410 для шестнадцатиразрядного представления:
Прямой код | Двоичный код числа 201410 со знаковым разрядом | 1000011111011110 |
Обратный код | Инвертирование (исключая знаковый разряд) | 1111100000100001 |
Прибавление единицы | 1111100000100001 + 0000000000000001 | |
Дополнительный код | 1111100000100010 |
При алгебраическом сложении двоичных чисел с использованием дополнительного кода положительные слагаемые представляют в прямом коде, а отрицательные — в дополнительном коде. Затем суммируют эти коды, включая знаковые разряды, которые при этом рассматриваются как старшие разряды. При переносе из знакового разряда единицу переноса отбрасывают. В результате получают алгебраическую сумму в прямом коде, если эта сумма положительная, и в дополнительном — если сумма отрицательная.
1) Найдем разность 1310 – 1210 для восьмибитного представления. Представим заданные числа в двоичной системе счисления:
Запишем прямой, обратный и дополнительный коды для числа –1210 и прямой код для числа 1310 в восьми битах:
1310 | –1210 | |
Прямой код | 00001101 | 10001100 |
Обратный код | — | 11110011 |
Дополнительный код | — | 11110100 |
Вычитание заменим сложением (для удобства контроля за знаковым разрядом условно отделим его знаком «_»):
Так как произошел перенос из знакового разряда, первую единицу отбрасываем, и в результате получаем 00000001.
2) Найдем разность 810 – 1310 для восьмибитного представления.
Запишем прямой, обратный и дополнительный коды для числа –1310 и прямой код для числа 810 в восьми битах:
810 | –1310 | |
Прямой код | 00001000 | 10001101 |
Обратный код | — | 11110010 |
Дополнительный код | — | 11110011 |
Вычитание заменим сложением:
В знаковом разряде стоит единица, а значит, результат получен в дополнительном коде. Перейдем от дополнительного кода к обратному, вычтя единицу:
11111011 – 00000001 = 11111010.
Перейдем от обратного кода к прямому, инвертируя все цифры, за исключением знакового (старшего) разряда: 10000101. Это десятичное число –510.
Определим диапазон чисел, которые могут храниться в оперативной памяти в формате длинных целых чисел со знаком (для хранения таких чисел отводится 32 бита памяти). Минимальное отрицательное число равно
А = –2 31 = –214748364810.
Максимальное положительное число равно
А = 2 31 – 1 = 214748364710.
Достоинствами формата с фиксированной запятой являются простота и наглядность представления чисел, простота алгоритмов реализации арифметических операций. Недостатком является небольшой диапазон представимых чисел, недостаточный для решения большинства прикладных задач.
Формат с плавающей запятой
Вещественные числа хранятся и обрабатываются в компьютере в формате с плавающей запятой, использующем экспоненциальную форму записи чисел.
Число в экспоненциальном формате представляется в таком виде:
$q$ — основание системы счисления;
Например, десятичное число 2674,381 в экспоненциальной форме запишется так:
Число в формате с плавающей запятой может занимать в памяти 4 байта (обычная точность) или 8 байтов (двойная точность). При записи числа выделяются разряды для хранения знака мантиссы, знака порядка, порядка и мантиссы. Две последние величины определяют диапазон изменения чисел и их точность.
Определим диапазон (порядок) и точность (мантиссу) для формата чисел обычной точности, т. е. четырехбайтных. Из 32 битов 8 выделяется для хранения порядка и его знака и 24 — для хранения мантиссы и ее знака.
Найдем максимальное значение порядка числа. Из 8 разрядов старший разряд используется для хранения знака порядка, остальные 7 — для записи величины порядка. Значит, максимальное значение равно 11111112 = 12710. Так как числа представляются в двоичной системе счисления, то
Аналогично, максимальное значение мантиссы равно
Кодирование текстовой информации. Кодировка ASCII. Основные используемые кодировки кириллицы
Соответствие между набором символов и набором числовых значений называется кодировкой символа. При вводе в компьютер текстовой информации происходит ее двоичное кодирование. Код символа хранится в оперативной памяти компьютера. В процессе вывода символа на экран производится обратная операция — декодирование, т. е. преобразование кода символа в его изображение.
Присвоенный каждому символу конкретный числовой код фиксируется в кодовых таблицах. Одному и тому же символу в разных кодовых таблицах могут соответствовать разные числовые коды. Необходимые перекодировки текста обычно выполняют специальные программы-конверторы, встроенные в большинство приложений.
Как правило, для хранения кода символа используется один байт (восемь битов), поэтому коды символов могут принимать значение от 0 до 255. Такие кодировки называют однобайтными. Они позволяют использовать 256 символов ( N = 2 I = 2 8 = 256 ). Таблица однобайтных кодов символов называется ASCII (American Standard Code for Information Interchange — Американский стандартный код для обмена информацией). Первая часть таблицы ASCII-кодов (от 0 до 127) одинакова для всех IBM-PC совместимых компьютеров и содержит:
Вторая часть таблицы (коды от 128 до 255) бывает различной в различных компьютерах. Она содержит коды букв национального алфавита, коды некоторых математических символов, коды символов псевдографики. Для русских букв в настоящее время используется пять различных кодовых таблиц: КОИ-8, СР1251, СР866, Мас, ISO.
В последнее время широкое распространение получил новый международный стандарт Unicode. В нем отводится по два байта (16 битов) для кодирования каждого символа, поэтому с его помощью можно закодировать 65536 различных символов ( N = 2 16 = 65536 ). Коды символов могут принимать значение от 0 до 65535.
Примеры решения задач
Пример. С помощью кодировки Unicode закодирована следующая фраза:
Я хочу поступить в университет!
Оценить информационный объем этой фразы.
Решение. В данной фразе содержится 31 символ (включая пробелы и знак препинания). Поскольку в кодировке Unicode каждому символу отводится 2 байта памяти, для всей фразы понадобится 31 ⋅ 2 = 62 байта или 31 ⋅ 2 ⋅ 8 = 496 битов.