Кодирование информации
Общие понятия
Определение 1
Кодирование — это преобразование информации из одной ее формы представления в другую, наиболее удобную для её хранения, передачи или обработки.
Определение 2
Кодом называют правило отображения одного набора знаков в другом.
Определение 3
Двоичный код – это способ представления информации с помощью двух символов — $0$ и $1$.
Определение 4
Длина кода – количество знаков, используемых для представления кодируемой информации.
Определение 5
Бит — это одна двоичная цифра $0$ или $1$. Одним битом можно закодировать два значения: $1$ или $0$. Двумя битами можно закодировать уже четыре значения: $00$, $01$, $10$, $11$. Тремя битами кодируются $8$ разных значений. Добавление одного бита удваивает количество значений, которое можно закодировать.
Рисунок 1.
Виды кодирования информации
Различают кодирование информации следующих видов:
Кодирование текстовой информации
Любой текст состоит из последовательности символов. Символами могут быть буквы, цифры, знаки препинания, знаки математических действий, круглые и квадратные скобки и т.д.
Текстовая информация, как и любая другая, хранится в памяти компьютера в двоичном виде. Для этого каждому ставится в соответствии некоторое неотрицательное число, называемое кодом символа, и это число записывается в память ЭВМ в двоичном виде. Конкретное соотношение между символами и их кодами называется системой кодировки. В персональных компьютерах обычно используется система кодировки ASCII (American Standard Code for Informational Interchange – Американский стандартный код для информационного обмена).
Замечание 1
Разработчики программного обеспечения создали собственные $8$-битные стандарты кодировки текста. За счет дополнительного бита диапазон кодирования в них был расширен до $256$ символов. Чтобы не было путаницы, первые $128$ символов в таких кодировках, как правило, соответствуют стандарту ASCII. Оставшиеся $128$ — реализуют региональные языковые особенности.
Замечание 2
Восьмибитными кодировками, распространенными в нашей стране, являются KOI8, UTF8, Windows-1251 и некоторые другие.
Кодирование цвета
Чтобы сохранить в двоичном коде фотографию, ее сначала виртуально разделяют на множество мелких цветных точек, называемых пикселями (что-то на подобии мозаики). После разбивки на точки цвет каждого пикселя кодируется в бинарный код и записывается на запоминающем устройстве.
Пример 1
Если говорят, что размер изображения составляет, например, $512 х 512$ точек, это значит, что оно представляет собой матрицу, сформированную из $262144$ пикселей (количество пикселей по вертикали, умноженное на количество пикселей по горизонтали).
Пример 2
Прибором, «разбивающим» изображения на пиксели, является любая современная фотокамера (в том числе веб-камера, камера телефона) или сканер. И если в характеристиках камеры значится, например, «$10$ Mega Pixels», значит количество пикселей, на которые эта камера разбивает изображение для записи в двоичном коде, — 10 миллионов. Чем на большее количество пикселей разделено изображение, тем реалистичнее выглядит фотография в декодированном виде (на мониторе или после распечатывания).
Однако качество кодирования фотографий в бинарный код зависит не только от количества пикселей, но также и от их цветового разнообразия. Алгоритмов записи цвета в двоичном коде существует несколько. Самым распространенным из них является RGB. Эта аббревиатура – первые буквы названий трех основных цветов: красного – англ.Red, зеленого – англ. Green, синего – англ. Blue. Смешивая эти три цвета в разных пропорциях, можно получить любой другой цвет или оттенок.
На этом и построен алгоритм RGB. Каждый пиксель записывается в двоичном коде путем указания количества красного, зеленого и синего цвета, участвующего в его формировании.
Чем больше битов выделяется для кодирования пикселя, тем больше вариантов смешивания этих трех каналов можно использовать и тем значительнее будет цветовая насыщенность изображения.
Определение 6
Цветовое разнообразие пикселей, из которых состоит изображение, называется глубиной цвета.
Кодирование графической информации
Описанная выше техника формирования изображений из мелких точек является наиболее распространенной и называется растровой. Но кроме растровой графики, в компьютерах используется еще и так называемая векторная графика.
Векторные изображения создаются только при помощи компьютера и формируются не из пикселей, а из графических примитивов (линий, многоугольников, окружностей и др.).
Векторная графика — это чертежная графика. Она очень удобна для компьютерного «рисования» и широко используется дизайнерами при графическом оформлении печатной продукции, в том числе создании огромных рекламных плакатов, а также в других подобных ситуациях. Векторное изображение в двоичном коде записывается как совокупность примитивов с указанием их размеров, цвета заливки, места расположения на холсте и некоторых других свойств.
Пример 3
Чтобы записать на запоминающем устройстве векторное изображение круга, компьютеру достаточно в двоичный код закодировать тип объекта (окружность), координаты его центра на холсте, длину радиуса, толщину и цвет линии, цвет заливки.
В растровой системе пришлось бы кодировать цвет каждого пикселя. И если размер изображения большой, для его хранения понадобилось бы значительно больше места на запоминающем устройстве.
Тем не менее, векторный способ кодирования не позволяет записывать в двоичном коде реалистичные фото. Поэтому все фотокамеры работают только по принципу растровой графики. Рядовому пользователю иметь дело с векторной графикой в повседневной жизни приходится не часто.
Кодирование числовой информации
При кодировании чисел учитывается цель, с которой цифра была введена в систему: для арифметических вычислений или просто для вывода. Все данные, кодируемые в двоичной системе, шифруются с помощью единиц и нолей. Эти символы еще называют битами. Этот метод кодировки является наиболее популярным, ведь его легче всего организовать в технологическом плане: присутствие сигнала – $1$, отсутствие – $0$. У двоичного шифрования есть лишь один недостаток – это длина комбинаций из символов. Но с технической точки зрения легче орудовать кучей простых, однотипных компонентов, чем малым числом более сложных.
Замечание 3
Целые числа кодируются просто переводом чисел из одной системы счисления в другую. Для кодирования действительных чисел используют $80$-разрядное кодирование. При этом число преобразуют в стандартный вид.
Кодирование звуковой информации
Определение 7
Любой звук, слышимый человеком, является колебанием воздуха, которое характеризируется двумя основными показателями: частотой и амплитудой. Амплитуда колебаний — это степень отклонения состояния воздуха от начального при каждом колебании. Она воспринимается нами как громкость звука. Частота колебаний — это количество отклонений состояний воздуха от начального за единицу времени. Она воспринимается как высота звука.
Пример 4
Так, тихий комариный писк — это звук с высокой частотой, но с небольшой амплитудой. Звук грозы наоборот имеет большую амплитуду, но низкую частоту.
Схему работы компьютера со звуком в общих чертах можно описать так. Микрофон превращает колебания воздуха в аналогичные по характеристикам электрических колебаний. Звуковая карта компьютера преобразовывает электрические колебания в двоичный код, который записывается на запоминающем устройстве. При воспроизведении такой записи происходит обратный процесс (декодирование) — двоичный код преобразуется в электрические колебания, которые поступают в аудиосистему или наушники. Динамики акустической системы или наушников имеют противоположное микрофону действие. Они превращают электрические колебания в колебания воздуха.
Принцип разделения звуковой волны на мелкие участки лежит в основе двоичного кодирования звука. Аудиокарта компьютера разделяет звук на очень мелкие временные участки и кодирует степень интенсивности каждого из них в двоичный код. Такое дробление звука на части называется дискретизацией. Чем выше частота дискретизации, тем точнее фиксируется геометрия звуковой волны и тем качественней получается запись.
Определение 8
Качество записи сильно зависит также от количества битов, используемых компьютером для кодирования каждого участка звука, полученного в результате дискретизации. Количество битов, используемых для кодирования каждого участка звука, полученного при дискретизации, называется
Кодирование видеозаписи
Видеозапись состоит из двух компонентов: звукового и графического.
Кодирование звуковой дорожки видеофайла в двоичный код осуществляется по тем же алгоритмам, что и кодирование обычных звуковых данных. Принципы кодирования видеоизображения схожи с кодированием растровой графики (рассмотрено выше), хотя и имеют некоторые особенности. Как известно, видеозапись — это последовательность быстро меняющихся статических изображений (кадров). Одна секунда видео может состоять из $25$ и больше картинок. При этом, каждый следующий кадр лишь незначительно отличается от предыдущего.
Учитывая эту особенность, алгоритмы кодирования видео, как правило, предусматривают запись лишь первого (базового) кадра. Каждый же последующий кадр формируются путем записи его отличий от предыдущего.
Кодирование информации. Двоичное кодирование. Единицы измерения информации
Тема: Информация вокруг насУрок: Кодирование информации. Двоичное кодирование. Единицы измерения информации
На данном уроке будут рассмотрены следующие вопросы:
1. Кодирование как изменение формы представления информации.
2. Как компьютер распознает информацию?
3. Как измерить информацию?
4. Единицы измерения информации.
В мире кодов
Зачем люди кодируют информацию?
1. Скрыть ее от других (зеркальная тайнопись Леонардо да Винчи, военные шифровки).
2. Записать информацию короче (стенография, аббревиатура, дорожные знаки).
3. Для более легкой обработки и передачи (азбука Морзе, перевод в электрические сигналы — машинные коды).
Кодирование — это представление информации с помощью некоторого кода.
Код — это система условных знаков для представления информации.
Способы кодирования информации
1. Графический (см. Рис. 1) (с помощью рисунков и знаков).
Рис. 1. Система сигнальных флагов (Источник)
2. Числовой (с помощью чисел).
Например: 11001111 11100101.
3. Символьный (с помощью символов алфавита).
Например: НКМБМ ЧГЁУ.
Декодирование — это действие по восстановлению первоначальной формы представления информации. Для декодирования необходимо знать код и правила кодирования.
Средством кодирования и декодирования служит кодовая таблица соответствия. Например, соответствие в различных системах счисления — 24 — XXIV, соответствие алфавита каким-либо символам (Рис. 2).
Рис. 2. Пример шифра (Источник)
Примеры кодирования информации
Примером кодирования информации является азбука Морзе (см. Рис. 3).
Рис. 3. Азбука Морзе (Источник)
В азбуке Морзе используется всего 2 символа — точка и тире (короткий и длинный звук).
Еще одним примером кодирования информации является флажковая азбука (см. Рис. 4).
Рис. 4. Флажковая азбука (Источник)
Также примером является азбука флагов (см. Рис. 5).
Рис. 5. Азбука флагов (Источник)
Всем известный пример кодирования — нотная азбука (см. Рис. 6).
Рис. 6. Нотная азбука (Источник)
Рассмотрим следующую задачу:
Используя таблицу флажковой азбуки (см. Рис. 7), необходимо решить следующую задачу:
Рис. 7
Старший помощник Лом сдает экзамен капитану Врунгелю. Помогите ему прочитать следующий текст (см. Рис. 8):
Рис. 8
Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером, компьютером и компьютером.
Кодирование — это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы.
Примером может служить язык жестов (см. Рис. 9).
Рис. 9. Азбука жестов (Источник)
Вокруг нас существуют преимущественно два сигнала, например:
— Светофор: красный — зеленый;
— Вопрос: да — нет;
— Лампа: горит — не горит;
— Можно — нельзя;
— Хорошо — плохо;
— Истина — ложь;
— Вперед — назад;
— Есть — нет;
— 1 — 0.
Всё это сигналы, обозначающие количество информации в 1 бит.
1 бит — это такое количество информации, которое позволяет нам выбрать один вариант из двух возможных.
Компьютер — это электрическая машина, работающая на электронных схемах. Чтобы компьютер распознал и понял вводимую информацию, ее надо перевести на компьютерный (машинный) язык.
Алгоритм, предназначенный для исполнителя, должен быть записан, то есть закодирован, на языке, понятном компьютеру.
Это электрические сигналы: проходит ток или не проходит ток.
Машинный двоичный язык — последовательность «0» и «1». Каждое двоичное число может принимать значение 0 или 1.
Каждая цифра машинного двоичного кода несет количество информации, равное 1 бит.
Устройства |
1 |
0 |
Электронные схемы |
Проводят электрический ток |
Не проводят электрический ток |
Участок поверхности магнитного носителя (жесткий диск, дискета) |
Намагничен |
Размагничен |
Участок поверхности лазерного диска |
Отражает луч |
Не отражает луч |
Двоичное число, которое представляет наименьшую единицу информации, называется бит. Бит может принимать значение либо 0, либо 1. Наличие магнитного или электронного сигнала в компьютере означает 1, отсутствие 0.
Строка из 8 битов называется байт. Эту строку компьютер обрабатывает как отдельный символ (число, букву).
Рассмотрим пример. Слово ALICE состоит из 5 букв, каждая из которых на языке компьютера представлена одним байтом (см. Рис. 10). Стало быть, Alice можно измерить как 5 байт.
Рис. 10. Двоичный код (Источник)
Кроме бита и байта, существуют и другие единицы измерения информации.
Название |
Сокращенное обозначение |
Размер в байтах |
Степень |
Килобайт |
Кбайт, Kb |
1 024 |
210 |
Мегабайт |
Мбайт, Mb |
1 048 576 |
220 |
Гигабайт |
Гбайт, Gb |
1 079 741 824 |
230 |
Терабайт |
Тбайт, Tb |
1 099 511 627 776 |
240 |
Список литературы
1. Босова Л.Л. Информатика и ИКТ: Учебник для 5 класса. – М.: БИНОМ. Лаборатория знаний, 2012.
2. Босова Л.Л. Информатика: Рабочая тетрадь для 5 класса. – М.: БИНОМ. Лаборатория знаний, 2010.
3. Босова Л.Л., Босова А.Ю. Уроки информатики в 5-6 классах: Методическое пособие. – М.: БИНОМ. Лаборатория знаний, 2010.
Рекомендованные ссылки на ресурсы интернет
1. Учительский портал (Источник).
2. Фестиваль «Открытый урок» (Источник).
3. Информатика в школе (Источник).
Домашнее задание
1. §1.6, 1.7 (Босова Л.Л. Информатика и ИКТ: Учебник для 5 класса).
2. Стр. 28, задания 1, 4; стр. 30, задания 1, 4, 5, 6 (Босова Л.Л. Информатика и ИКТ: Учебник для 5 класса).
Кодирование информации
Одно из основных достоинств компьютера связано с тем, что это удивительно универсальная машина. Каждый, кто хоть когда-нибудь с ним сталкивался, знает, что занятие арифметическими подсчетами составляет совсем не главный метод использования компьютера. Компьютеры прекрасно воспроизводят музыку и видеофильмы, с их помощью можно организовывать речевые и видеоконференции в Интернет, создавать и обрабатывать графические изображения, а возможность использования компьютера в сфере компьютерных игр на первый взгляд выглядит совершенно несовместимой с образом суперарифмометра, перемалывающего сотни миллионов цифр в секунду.
Составляя информационную модель объекта или явления, мы должны договориться о том, как понимать те или иные обозначения. То есть договориться о виде представления информации.
Человек выражает свои мысли в виде предложений, составленных из слов. Они являются алфавитным представлением информации. Основу любого языка составляет алфавит — конечный набор различных знаков (символов) любой природы, из которых складывается сообщение.
Одна и та же запись может нести разную смысловую нагрузку. Например, набор цифр 251299 может обозначать: массу объекта; длину объекта; расстояние между объектами; номер телефона; запись даты 25 декабря 1999 года.
Для представления информации могут использоваться разные коды и, соответственно, надо знать определенные правила — законы записи этих кодов, т.е. уметь кодировать.
Код — набор условных обозначений для представления информации.
Кодирование — процесс представления информации в виде кода.
Для общения друг с другом мы используем код — русский язык. При разговоре этот код передается звуками, при письме — буквами. Водитель передает сигнал с помощью гудка или миганием фар. Вы встречаетесь с кодированием информации при переходе дороги в виде сигналов светофора. Таким образом, кодирование сводиться к использованию совокупности символов по строго определенным правилам.
Кодировать информацию можно различными способами: устно; письменно; жестами или сигналами любой другой природы.
Кодирование данных двоичным кодом.
По мере развития техники появлялись разные способы кодирования информации. Во второй половине XIXвека американский изобретатель Сэмюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Информация кодируется тремя символами: длинный сигнал (тире), короткий сигнал (точка), нет сигнала (пауза) — для разделения букв.
Своя система существует и в вычислительной технике — она называется двоичным кодированиеми основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называютсядвоичными цифрами, по-английски -binary digit или сокращенноbit(бит).
Одним битом могут быть выражены два понятия: 0 или 1 (даилинет, черноеилибелое, истинаилиложьи т.п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:
00 01 10 11
Тремя битами можно закодировать восемь различных значений:
000 001 010 011 100 101 110 111
Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе, то есть общая формула имеет вид:
,
где N- количество независимых кодируемых значений;
m — разрядность двоичного кодирования, принятая в данной системе.
m | N |
1 | 2 |
2 | 4 |
3 | 8 |
4 | 16 |
… | … |
8 | 256 |
Кодирование информации — урок. Информатика, 5 класс.
Информация, которую мы получаем из окружающего мира, поступает к нам в виде условных знаков или сигналов самой разной физической природы.
Это свет, звук, запах, касания; это слова, значки, символы, жесты и движения.
Для того чтобы произошла передача информации, мы должны не только принять сигнал от кого-то, но и расшифровать его.
Так, услышав звонок будильника, человек понимает, что пришло время просыпаться;
телефонный звонок — кому-то нужно с нами поговорить;
школьный звонок сообщает учащимся о долгожданной перемене.
Для правильного понятия разных сигналов требуется разработка кода или кодирование.
Код — это система условных знаков для представления информации.
Кодирование — это перевод информации в удобную для передачи, обработки или хранения форму с помощью некоторого кода.
Обратное преобразование называется декодированием.
Декодирование — это процесс восстановления содержания закодированной информации.
Существует три основных способа кодирования информации:
- Числовой способ — с помощью чисел.
- Символьный способ — информация кодируется с помощью символов того же алфавита, что и исходящий текст.
- Графический способ — информация кодируется с помощью рисунков или значков.
Множество кодов очень прочно вошло в нашу жизнь. Так,
- числовая информация кодируется арабскими, римскими цифрами и др.
- для общения и письма мы используем код — русский язык, в Китае — китайский и т.д.
- с помощью нотных знаков кодируется любое музыкальное произведение, а на экране проигрывателя вы можете увидеть громкий или тихий звук, закодированный с помощью графика.
- часто бывает так, что информацию надо сжать и представить в краткой, но понятной форме. Тогда применяют пиктограммы, например, на двери магазина, на столбах в парке, на дороге.
Для передачи информации, людьми были придуманы специальные коды, к ним относятся:
- азбука Брайля,
- азбука Морзе,
- семафорная азбука и др.
Методами шифрования занимается специальная наука — криптография.
Источники:
Босова Л.Л., Босова А.Ю. Информатика. Учебник для 5 класса. — М.: БИНОМ. Лаборатория знаний, 2013 — 46 с.
Кодирование информации
Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.
Кодирование информации – это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.
Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.
Знак — это элемент конечного множества отличных друг от друга элементов.
В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.
Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации, например «наложить» друг на друга звуки от разных источников.
Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.
Способы кодирования информации.
Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества — письменность и арифметика — есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.
Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.
Кодирование символьной (текстовой) информации.
Основная операция, производимая над отдельными символами текста — сравнение символов.
При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.
Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.
Таблица перекодировки — таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно.
Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.
Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.
Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.
Кодирование числовой информации.
Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления.
Основной системой счисления для представления чисел в компьютере является двоичная позиционная система счисления.
Кодирование текстовой информации
В настоящее время, большая часть пользователей, при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Подсчитаем, сколько всего символов и какое количество бит нам нужно.
10 цифр, 12 знаков препинания, 15 знаков арифметических действий, буквы русского и латинского алфавита, ВСЕГО: 155 символов, что соответствует 8 бит информации.
Единицы измерения информации.
1 байт = 8 бит
1 Кбайт = 1024 байтам
1 Мбайт = 1024 Кбайтам
1 Гбайт = 1024 Мбайтам
1 Тбайт = 1024 Гбайтам
Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.
Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ — 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой
Основным отображением кодирования символов является код ASCII — American Standard Code for Information Interchange- американский стандартный код обмена информацией, который представляет из себя таблицу 16 на 16, где символы закодированы в шестнадцатеричной системе счисления.
Кодирование графической информации.
Важным этапом кодирования графического изображения является разбиение его на дискретные элементы (дискретизация).
Основными способами представления графики для ее хранения и обработки с помощью компьютера являются растровые и векторные изображения
Векторное изображение представляет собой графический объект, состоящий из элементарных геометрических фигур (чаще всего отрезков и дуг). Положение этих элементарных отрезков определяется координатами точек и величиной радиуса. Для каждой линии указывается двоичные коды типа линии (сплошная, пунктирная, штрихпунктирная), толщины и цвета.
Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации изображения в соответствии с матричным принципом.
Матричный принцип кодирования графических изображений заключается в том, что изображение разбивается на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.
Pixel (picture element — элемент рисунка) — минимальная единица изображения, цвет и яркость которой можно задать независимо от остального изображения.
В соответствии с матричным принципом строятся изображения, выводимые на принтер, отображаемые на экране дисплея, получаемые с помощью сканера.
Качество изображения будет тем выше, чем «плотнее» расположены пиксели, то есть чем больше разрешающая способность устройства, и чем точнее закодирован цвет каждого из них.
Для черно-белого изображения код цвета каждого пикселя задается одним битом.
Если рисунок цветной, то для каждой точки задается двоичный код ее цвета.
Поскольку и цвета кодируются в двоичном коде, то если, например, вы хотите использовать 16-цветный рисунок, то для кодирования каждого пикселя вам потребуется 4 бита (16=24), а если есть возможность использовать 16 бит (2 байта) для кодирования цвета одного пикселя, то вы можете передать тогда 216 = 65536 различных цветов. Использование трех байтов (24 битов) для кодирования цвета одной точки позволяет отразить 16777216 (или около 17 миллионов) различных оттенков цвета — так называемый режим “истинного цвета” (True Color). Заметим, что это используемые в настоящее время, но далеко не предельные возможности современных компьютеров.
Кодирование звуковой информации.
Из курса физики вам известно, что звук — это колебания воздуха. По своей природе звук является непрерывным сигналом. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение.
Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел, а для этого его необходимо дискретизировать и оцифровать.
Можно поступить следующим образом: измерять амплитуду сигнала через равные промежутки времени и записывать полученные числовые значения в память компьютера.
Кодирование информации в информатике
Определение 1
Под кодированием понимается преобразование информации в другой (альтернативный) формат. По существу, системы кодирования являются аналогом шифру поимённой подмены, когда каждый единичный модуль информационных данных, подлежащих кодировке, заменяется соответствующим ему шифром.
Однако есть и отличие, и оно состоит в наличии у операции шифрования так называемой изменяемой части (ключа). Эта изменяемая часть для одного и того же передаваемого сообщения и при неизменном алгоритме, способна выдать различные тексты шифровки. При использовании кодировки вместо шифрования, такой изменяемой составляющей просто нет. Именно из-за этого одно и тоже передаваемое сообщение при многократном кодировании не меняет свой вид, а всегда имеет одинаковый формат.
Ещё одним отличием кодирования можно считать использование кодовых заменителей для целых слов и даже предложений или набора цифр. Подмена частей информации, подлежащей кодированию, кодовыми символами выполняется на базе специальных таблиц (аналогичных таблицам шифровальных замен) или определяется с помощью алгоритмов или функций для кодировок.
Компоненты информации, подлежащей кодированию
Компонентами информации, подлежащими кодированию могут быть:
- Предложения (фразы) разговорной речи, отдельные слова или буквы.
- Разные символьные обозначения, к примеру, операции логики и арифметики, знаки препинания, операторы сравнения (больше, меньше, равно) и тому подобное. Надо заметить, что сами знаки операций и операторы сравнения относятся к кодовым обозначениям.
- Цифры (числа).
- Аудио и визуальные объекты (образы).
- Различные явления и ситуации.
- Информация, переданная по наследству.
Кодовыми обозначениями могут выступать:
- Комбинации букв разговорного языка и непосредственно буквы.
- Различные цифры (числа).
- Обозначения в виде графических изображений.
- Звуковые и световые команды (сигналы)
- Электрические и электромагнитные импульсы.
- Комбинация различных химических молекул.
Основные задачи кодирования
Основными задачами (целями) кодирования информации являются:
- Создать дополнительные преимущества для сохранения, анализа и пересылки данных (практически всегда информация в виде кодов занимает меньше места в памяти и более приспособлена для работы с ней и пересылки автоматизированными программными и техническими средствами).
- Обеспечить удобный обмен информацией между объектами.
- Сделать наглядным отображение.
- Выполнить идентификацию субъектов и объектов.
- Скрыть доступ к секретной информации.
Существует одноуровневое кодирование информации и многоуровневое.
Например, световые сигналы светофора (красный, жёлтый, зелёный) — это одно уровневое кодирование.
Многоуровневым кодированием является визуальный образ фотографии, сохранённый как отдельный файл. Сначала фотография расчленяется на отдельные мелкие модули (пиксели), то есть все мелкие составляющие части изображения кодируются элементарными модулями (элементами). Каждый элемент может быть представлен как набор составляющих основных цветов: красного, зелёного и синего каждый с требуемой амплитудой (интенсивностью), выраженной в форме числа. В дальнейшем числовые наборы переформатируются (перекодируются) для того, чтобы сделать информацию более компактной (к примеру, форматы jpeg, png и так далее). В итоге, полученные числовые значения преобразуются (перекодируются) в электромагнитные импульсы и передаются по специальным каналам для коммутации или зонам на информационных носителях.
Необходимо заметить, что конкретные числовые значения при работе программы, представлены согласно правилам используемой системы кодировки чисел.
Существуют обратимые и необратимые способы кодирования информационных данных:
- Если используется обратимое кодирование, то закодированная информация всегда может быть восстановлена без потери данных. К таким типам кодирования можно отнести, к примеру, азбуку Морзе или штрих-кодирование.
- При применении необратимого кодирования нет возможности достоверно восстановить исходную информацию. Примерами могут служить коды аудио и визуальной информации (в форматах jpg, mp3 или avi), а также хеширование.
Существуют системы кодирования с общим доступом и засекреченные системы. Первый тип применяется для улучшения качества обмена информацией, второй тип для обеспечения скрытности данных от несанкционированного доступа.
Системы кодирования с общим доступом
Использование кодирования широко применяется в реальной жизненной практике. Выше было отмечено, что к кодовым обозначениям причислены сами обозначения операций логики и арифметики. К примеру, обозначение «+» при сложении и минус «–» при вычитании изобрели в Германии, в школе математиков «коссистов» (то есть алгебраистов). Они уже были в «Арифметике» Иоганна Видмана, которая была издана в 1489 году. Ранее операцию сложения обозначали символом p (plus) или на латыни словом et, а операция вычитания обозначалась символом m (minus).
Другие примеры общеизвестных кодовых систем:
- Знаки дорожного движения.
- Знаки, обозначающие химические элементы в периодической системе элементов Д.И. Менделеева.
- Обозначения знаков зодиака.
- Сокращения названий изучаемых курсов в расписаниях занятий студентов.
При кодировании способом азбуки Морзе, все символы (буквы, цифры, и другие) заменяются последовательным набором тире и точек. За элементарный временной интервал принято время звучания одной точки, а чтобы отличить тире, его время принято равным длительности трёх точек. Чтобы выделить начало следующего элемента кодирования, используют паузу, длительность которой равна одной точке (это примерно 0,4 секунды). Пауза между символами в слове равна трём точкам, пауза между словами составляет семь точек. Изобрёл эту систему кодирования американский изобретатель и художник Сэмюэль Морзе.
10. Виды кодирования информации
10. Виды кодирования информации.
Код – условное обозначение объекта знаком или группой знаков по определенным правилам. После присвоения кодов создается классификатор – систематизированный свод однородных наименований и их кодовых обозначений. Классификаторы имеют двоякое применение. Первое – для ручного проставления кодов в документах. Во втором случае применения кодов предусматривается хранение всех классификаторов в памяти машины, на машинных носителях. Коды могут быть цифровыми, буквенными, буквенно-цифровыми и состоять из одного или нескольких знаков.
Кодирование информации — представление сведений в стандартной форме. Одни и те же сведения могут быть представлены в нескольких разных формах, и наоборот, разные сведения можно представить в похожей форме. Например, можно использовать словесное описание новой марки автомобиля, а можно представить его вид в нескольких детальных фотографиях. Другой пример — медицинские справки одной формы имеют одинаковый внешний вид, но описывают разные болезни, так как выданы разным людям.
С появлением компьютеров возникла необходимость кодирования всех видов информации, с которой имеет дело и отдельный человек и всё человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров: грандиозные достижения человечества — письменность и арифметика — не что иное, как системы кодирования речи и числовой информации.
Кодирование чисел
Чтобы использовать числа, нужно их как-то называть и записывать, нужна система нумерации. Различные системы счёта и записи чисел тысячелетиями сосуществовали и соревновались между собой, но к концу «докомпьютерной эпохи» особую роль при счёте стало играть число «десять», а самой популярной системой кодирования оказалась позиционная десятичная система. В этой системе значение цифры в числе зависит от её места (позиции) внутри числа. Десятичная система счисления пришла из Индии (не позднее VI века нашей эры). Алфавит этой системы: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} — всего 10 цифр, таким образом, основание системы счисления — 10. Число записывается как комбинация единиц, десятков, сотен, тысяч и так далее. Пример: 1998=8*100 + 9*101 + 9*102 + 1*103.
В Вавилоне, например, использовалась 60-ричная система счисления, алфавит содержал цифры от 1 до 59, числа 0 не было, таблицы умножения были очень громоздкими, поэтому очень скоро она была забыта, но отголоски её былой распространённости можно наблюдать и сейчас — деление часа на 60 минут, деление круга на 360 градусов.
Двоичная система счисления
Двоичная система счисления была придумана математиками и философами ещё до появления компьютеров (XVII — XIX вв.). Позже двоичная система была забыта, и только в 1936 — 1938 годах американский инженер и математик Клод Шеннон нашёл замечательные применения двоичной системы при конструировании электронных схем.
Существуют системы счисления, родственные двоичной. При работе с компьютерами иногда приходится иметь дело с двоичными числами, так как двоичные числа заложены в конструкцию компьютера. Двоичная система удобна для компьютера, но неудобна для человека — слишком длинные числа неудобно записывать и запоминать. На помощь приходят системы счисления, родственные двоичной — восьмеричная и шестнадцатеричная.
Например, в шестнадцатеричной системе для записи чисел предназначены 10 арабских цифр и буквы латинского алфавита {А, В, С, D, Е, F}. Чтобы записать число в этой системе счисления, удобно воспользоваться двоичным представлением числа. Возьмём для примера то же число — 2000 или 11111010000 в двоичной системе. Разобьём его на четвёрки знаков, двигаясь справа налево, в последней четвёрке слева припишем незначащий 0, чтобы количество знаков в триадах было по четыре: 0111 1101 0000. Начнём перевод — числу 0111 в двоичной системе соответствует число 7 в десятичной (710=1*20+1*21+1*22), в шестнадцатеричной системе счисления цифра 7 есть; числу 1101 в двоичной системе соответствует число 13 в десятичной (13=1*20 + 0*21 + 1*22 + 1*23), в шестнадцатеричной системе этому числу соответствует цифра D, и, наконец, число 0000 — в любой системе счисления 0. Запишем теперь результат:
111110100002 = 7D016.
Кодирование координат
Закодировать можно не только числа, но и другую информацию. Например, информацию о том, где находится некоторый объект. Величины, определяющие положение объекта в пространстве, называются координатами. В любой системе координат есть начало отсчёта, единица измерения, масштаб, направление отсчёта, или оси координат. Примеры систем координат — декартовы координаты, полярная система координат, шахматы, географические координаты.
Кодирование текста
Текст закодировать довольно просто. Для этого достаточно как-нибудь перенумеровать все буквы, цифры, знаки препинания и другие, используемые при письме символы. Для хранения одного символа чаще всего используется восьмиразрядная ячейка — один байт, иногда два байта (иероглифы, например). В байт можно записать 256 различных чисел, значит, это позволит закодировать 256 различных символов. Соответствие символов и их кодов задаётся в специальной таблице. Коды записываются в шестнадцатеричной системе, так как для записи числа из восьми разрядов нужно всего две шестнадцатеричных цифры.
Кодирование изображений
Цифровые персональные компьютеры хорошо работают с числами, но не умеют обрабатывать непрерывные величины. Но человеческий глаз можно обмануть: изображение, составленное из большого числа отдельных мелких деталей, воспринимается как непрерывное. Если разбить картинку вертикальными и горизонтальными линиями на маленькие мозаичные квадратики, получим так называемый растр — двумерный массив квадратиков. Сами квадратики — элементы растра или пиксели (picture’s element) — элементы картинки. Цвет каждого пикселя кодируется числом.