Примеры кодирования информации в информатике: Кодирование информации — Физика, Информатика и ИКТ – Примеры кодирования | Практическая информатика

Содержание

Примеры кодирования | Практическая информатика

Среди всего разнообразия информации, обрабатываемой на компьютере, значительную часть составляют числовая, текстовая, графическая и аудиоинформация. Познакомимся с некоторыми способами кодирования этих типов информации в ЭВМ.

Кодирование чисел

Существуют два основных формата представления чисел в памяти компьютера. Один из них используется для кодирования целых чисел, второй (так называемое представление числа в формате с плавающей точкой) используется для задания некоторого подмножества действительных чисел.

Множество целых чисел, представимых в памяти ЭВМ, ограничено. Диапазон значений зависит от размера области памяти, используемой для размещения чисел. В k-разрядной ячейке может храниться 2k различных значений целых чисел.

Чтобы получить внутреннее представление целого положительного числа N, хранящегося в k-разрядном машинном слове, необходимо:

1)  перевести число N в двоичную систему счисления;
2)  полученный результат дополнить слева незначащими нулями до k разрядов.


Пример

Получить внутреннее представление целого числа 1607 в 2-х байтовой ячейке.

Переведем число в двоичную систему: 160710 = 110010001112. Внутреннее представление этого числа в ячейке будет следующим: 0000 0110 0100 0111.

Для записи внутреннего представления целого отрицательного числа (-N) необходимо:

1)  получить внутреннее представление положительного числа N;
2)  обратный код этого числа заменой 0 на 1 и 1 на 0;
3)  полученному числу прибавить 1.


Пример

Получим внутреннее представление целого отрицательного числа -1607. Воспользуемся результатом предыдущего примера и запишем внутреннее представление положительного числа 1607: 0000 0110 0100 0111. Инвертированием получим обратный код: 1111 1001 1011 1000. Добавим единицу: 1111 1001 1011 1001 — это и есть внутреннее двоичное представление числа -1607.

Формат с плавающей точкой использует представление вещественного числа R в виде произведения мантиссы m на основание системы счисления n в некоторой целой степени p, которую называют порядком: R = m * n p.

Представление числа в форме с плавающей точкой неоднозначно. Например, справедливы следующие равенства:

12.345 = 0.0012345 x 104 = 1234.5 x 10-2 = 0.12345 x 102

Чаще всего в ЭВМ используют нормализованное представление числа в форме с плавающей точкой. Мантисса в таком представлении должна удовлетворять условию: 0.1p <= m < 1p. Иначе говоря, мантисса меньше 1 и первая значащая цифра — не ноль (p — основание системы счисления).

В памяти компьютера мантисса представляется как целое число, содержащее только значащие цифры (0 целых и запятая не хранятся), так для числа 12.345 в ячейке памяти, отведенной для хранения мантиссы, будет сохранено число 12345. Для однозначного восстановления исходного числа остается сохранить только его порядок, в данном примере — это 2.

Кодирование текста

Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.

Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ.

Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.

Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является уже упоминавшаяся таблица кодировки ASCII.

Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.

Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов. О кодировании символов русского алфавита рассказывается в главе «Обработка документов».

Кодирование графической информации

В видеопамяти находится двоичная информация об изображении, выводимом на экран. Почти все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части — растровую и векторную графику.

Растровые изображения представляют собой однослойную сетку точек, называемых пикселами (pixel, от англ. picture element). Код пиксела содержит информации о его цвете.

Для черно-белого изображения (без полутонов) пиксел может принимать только два значения: белый и черный (светится — не светится), а для его кодирования достаточно одного бита памяти: 1 — белый, 0 — черный.

Пиксел на цветном дисплее может иметь различную окраску, поэтому одного бита на пиксел недостаточно. Для кодирования 4-цветного изображения требуются два бита на пиксел, поскольку два бита могут принимать 4 различных состояния. Может использоваться, например, такой вариант кодировки цветов: 00 — черный, 10 — зеленый, 01 — красный, 11 — коричневый.

На RGB-мониторах все разнообразие цветов получается сочетанием базовых цветов — красного (Red), зеленого (Green), синего (Blue), из которых можно получить 8 основных комбинаций:

RGBцвет
0  0  0  черный
0  0  1  синий
0  1  0  зеленый
0  1  1  голубой
RGBцвет
1  0  0  красный
1  0  1  розовый
1  1  0  коричневый
1  1  1  белый

Разумеется, если иметь возможность управлять интенсивностью (яркостью) свечения базовых цветов, то количество различных вариантов их сочетаний, порождающих разнообразные оттенки, увеличивается. Количество различных цветов — К и количество битов для их кодировки — N связаны между собой простой формулой: 2N = К.

В противоположность растровой графике векторное изображение многослойно. Каждый элемент векторного изображения — линия, прямоугольник, окружность или фрагмент текста — располагается в своем собственном слое, пикселы которого устанавливаются независимо от других слоев. Каждый элемент векторного изображения является объектом, который описывается с помощью специального языка (математических уравнения линий, дуг, окружностей и т. д.). Сложные объекты (ломаные линии, различные геометрические фигуры) представляются в виде совокупности элементарных графических объектов.

Объекты векторного изображения, в отличии от растровой графики, могут изменять свои размеры без потери качества (при увеличении растрового изображения увеличивается зернистость). Подробнее о графических форматах рассказывается в разделе «Графика на компьютере».

Кодирование звука

Из курса физики вам известно, что звук — это колебания воздуха. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой — аналоговый — сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел.

Поступим следующим образом. Будем измерять напряжение через равные промежутки времени и записывать полученные значения в память компьютера. Этот процесс называется дискретизацией (или оцифровкой), а устройство, выполняющее его — аналого-цифровым преобразователем (АЦП).

Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит

цифро-аналоговый преобразователь — ЦАП), а затем сгладить получившийся ступенчатый сигнал.

Чем выше частота дискретизации (т. е. количество отсчетов за секунду) и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук. Но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.

Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами. Но бывают случаи, когда выгодней действовать по-иному.

Человек издавна использует довольно компактный способ представления музыки — нотную запись. В ней специальными символами указывается, какой высоты звук, на каком инструменте и как сыграть. Фактически, ее можно считать алгоритмом для музыканта, записанным на особом формальном языке. В 1983 г. ведущие производители компьютеров и музыкальных синтезаторов разработали стандарт, определивший такую систему кодов. Он получил название MIDI.

Конечно, такая система кодирования позволяет записать далеко не всякий звук, она годится только для инструментальной музыки. Но есть у нее и неоспоримые преимущества: чрезвычайно компактная запись, естественность для музыканта (практически любой MIDI-редактор позволяет работать с музыкой в виде обычных нот), легкость замены инструментов, изменения темпа и тональности мелодии.

Заметим, что существуют и другие, чисто компьютерные, форматы записи музыки. Среди них следует отметить формат MP3, позволяющий с очень большим качеством и степенью сжатия кодировать музыку. При этом вместо 18—20 музыкальных композиций на стандартный компакт-диск (CDROM) помещается около 200. Одна песня занимает примерно 3,5 Mb, что позволяет пользователям сети Интернет легко обмениваться музыкальными композициями.

В мире кодов. Способы кодирования информации

Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 5 классы | Планирование уроков на учебный год (ФГОС) | В мире кодов. Способы кодирования информации





Ключевые слова:

• код
• кодирование

Информация может поступать от источника к приёмнику с помощью сигналов самой разной физической природы. Например, сигнал может быть световым, звуковым, тепловым, электрическим или в виде жеста, движения, слова, сломанной веточки на дереве, другого условного знака.

Для того чтобы произошла передача информации, приёмник информации должен не только получить сигнал, но и расшифровать его. Так, услышав звонок будильника, ученик понимает, что пришло время просыпаться и собираться в школу. Телефонный звонок означает, что кому-то нужно с вами поговорить.

Звонок в дверь сообщает, что кто-то пришёл, а школьный звонок собирает ребят на урок или оповещает их о долгожданной перемене.

Необходимо заранее договариваться, как понимать те или иные сигналы, другими словами, требуется разработка кода.

Код — это система условных знаков для представления информации. Кодирование — это представление информации с помощью некоторого кода.

Множество кодов очень прочно вошло в нашу жизнь. Так, для общения в нашей стране используется код — русский язык. Код используется для оценки знаний в школе (число 5 — код отличных знаний, 4 — код хороших знаний, 3 — удовлетворительных, 2 — плохих).

С помощью нотных знаков записывается (кодируется) любое музыкальное произведение. По номерному знаку можно узнать сведения об автомобиле и его владельце.

В современных супермаркетах каждый товар имеет на упаковке штрих-код — метку, состоящую из чёрных линий. Для чтения штрих-кодов применяют специальные сканеры. С их помощью в компьютер вводят информацию о стоимости покупки.

Правила дорожного движения кодируются с помощью наглядных символических рисунков. Всем хорошо известны следующие дорожные знаки, изображённые на рис. 15.

Свой код из шести цифр (почтовый индекс) имеет каждый населённый пункт Российской Федерации. Его следует писать на конверте в специально отведённом для этого месте (рис. 16). По коду можно узнать, куда отправлять письмо. Например, код города Москвы и коды всех населённых пунктов Московской области начинаются с цифры 1.

В середине XIX века французский педагог Луи Брайль придумал специальный способ представления информации для слепых. «Буквы» этого кода выдавливаются на листе плотной бумаги. Одна буква занимает два столбика, в каждом из которых может быть выдавлено от одной до трёх точек (рис. 17). Проводя пальцами по выступам, незрячие люди различают буквы и могут читать.

В памяти компьютера информация представлена в двоичном коде в виде цепочек нулей и единиц. Каждому символу, вводимому с клавиатуры, соответствует уникальная цепочка из восьми 0 и 1. Например, буква «Q» имеет двоичный код 01010001, а цифра «7» — 00110111.

Пример 1. Составим простейшую кодовую таблицу, поставив в соответствие каждой букве её порядковый номер в алфавите. Тогда скороговорка

ОТ ТОПОТА КОПЫТ
ПЫЛЬ ПО ПОЛЮ ЛЕТИТ

в закодированном виде будет выглядеть так:

16 20 20 16 17 16 20 1 12 16 17 29 20
17 29 13 30 17 16 17 16 13 32 13 6 20 10 20

Пример 2. Можно закодировать информацию, заменяя каждую букву исходного текста, например, следующей после неё буквой в алфавите. Такой код называют шифром замены. В этом случае исходное сообщение

АЛ ЦВЕТ МИЛ НА ВЕСЬ СВЕТ
примет вид:
БМ ЧГЁУ НКМ ОБ ГЁТЭ ТГЁУ

О кодировании информации с помощью языка жестов можно прочитать в электронном приложении к учебнику.


Способы кодирования информации

Одна и та же информация может быть представлена разными кодами, иначе говоря, в разных формах.

Люди выработали множество форм представления информации. К ним относятся: разговорные языки (русский, английский, немецкий — всего более 2000 языков), язык мимики и жестов, язык рисунков и чертежей, научные языки (например, язык математики), языки искусства (музыка, живопись, скульптура), специальные языки (азбука Брайля, азбука Морзе, флажковая азбука).

Способ кодирования (форма представления) информации зависит от цели, ради которой осуществляется кодирование. Такими целями могут быть сокращение записи, засекречивание (шифровка) информации, удобство обработки и т. п.

Чаще всего применяют следующие способы кодирования информации:

1) графический — с помощью рисунков или значков;
2) числовой — с помощью чисел;
3) символьный — с помощью символов того же алфавита, что и исходный текст.

Переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки, также называют кодированием.

Действия по восстановлению первоначальной формы представления информации принято называть декодированием. Для декодирования надо знать код.

САМОЕ ГЛАВНОЕ

Передаваемая информация может поступать от источника к приёмнику с помощью условных знаков или сигналов, то есть в закодированном виде.

Код — это система условных знаков для представления информации.

Кодирование — это представление информации с помощью некоторого кода.

Выбор способа кодирования зависит от цели, ради которой оно осуществляется.

Чтобы декодировать закодированное сообщение, необходимо знать код.

Вопросы и задания

1. Что вы понимаете под кодированием информации?

2. С какой целью люди кодируют информацию?

3. Ребус — это слово или фраза, закодированные с помощью комбинации фигур, букв и других знаков. Попробуйте декодировать сообщение, т. е. разгадать следующий ребус:


Составьте ребус для одного из следующих слов: информация, кодирование, хранение, передача, обработка.

4. Какие знаки используются для представления информации при:

а) записи арифметических выражений;
б) записи мелодий;
в) записи звуков речи;
г) оформлении календаря погоды;
д) управлении движением транспорта?

5. Зависит ли форма представления информации от носителя информации (бумага, камень, электронный носитель информации)?

6. Выразите словами смысл следующего арифметического выражения:

1+2+3+4+5 = 5
—————-
10-7    

7. Мальчик заменил каждую букву своего имени её номером в алфавите. Получилось 18 21 19 13 1 15. Как зовут мальчика?

8. Зная, что каждая буква исходного текста заменяется третьей после неё буквой в алфавите русского языка, который считается записанным по кругу (после «Я» идёт «А»), декодируйте следующие сообщения:

а) жуцёг льл, г ргмжиыя — дзузёл;
б) фхгуюм жуцё оцъыз рсеюш жецш.

9. Каждой букве алфавита поставлена в соответствие пара чисел: первое число — номер столбца, а второе — номер строки следующей кодовой таблицы:

1 2 3 4 5 6 7 8 9 10 11 12
1 к л м н о ь ъ ы э ю я <пробел>
2 п р с т у ф х ч ц ш щ ,
3 а б в г д е ё ж з и й .

Пользуясь данной таблицей, расшифруйте головоломку: (1,1), (2.2), (1,3), (3,2), (10,3), (3,3), (12,1), (4,2), (5,1), (4,2), (12,2), (12,1), (1,1), (4,2), (5,1), (12,1), (1,1), (2,2), (1,3), (3,2), (10,3), (3.3) , (5,1), (12,1), (1,2), (5,1), (3,2), (4,2), (5,2), (1,2), (1,3), (6.3), (4,2), (12,3).

Электронное приложение к уроку

liniya

liniya liniya liniya
Презентации, плакаты, текстовые файлы Вернуться к материалам урока Ресурсы ЕК ЦОР

liniya

Cкачать материалы урока

liniya

5Кодирование информации, его способы. Привести примеры.

В процессе преобразования информации из одной формы представления (знаковой системы) в другую осуществляется кодирование.

 В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. При вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на клавиатуре выполняется его кодирование, т. е. преобразование в компьютерный код.

При выводе знака на экран монитора или принтер происходит обратный процесс — декодирование, когда из компьютерного кода знак преобразуется в графическое изображение.

Кодирование изображений и звука.  

Примером аналогового представления графической информации может служить, скажем, живописное полотно, цвет которого изменяется непрерывно, а дискретного — изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета.

Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

6 Арифметические основы компьютера. Системы счисления. Определение системы счисления. Позиционные и непозиционные системы счисления.

Рассмотрим основные арифметические операции: сложение, вычитание, умножение и деление. Правила выполнения этих операций в десятичной системе хорошо известны — это сложение, вычитание, умножение столбиком и деление углом. Эти правила применимы и ко всем другим позиционным системам счисления.

 При сложении цифры суммируются по разрядам, и если при этом возникает избыток, то он переносится влево.

При вычитании цифры вычитаются по разрядам, и если при этом возникает недостаток, то происходит заем в старших разрядах.

 Выполняя умножение многозначных чисел в различных позиционных системах счисления, можно использовать обычный алгоритм перемножения чисел в столбик, но при этом результаты перемножения и сложения однозначных чисел необходимо заимствовать из соответствующих рассматриваемой системе таблиц умножения и сложения.

Деление в любой позиционной системе счисления производится по тем же правилам, как и деление углом в десятичной системе. В двоичной системе деление выполняется особенно просто, ведь очередная цифра частного может быть только нулем или единицей.

Система счисления.

Система счисле́ния —  представление чисел с помощью письменных знаков.

Позиционные системы счисления — это системы счисления, в которых значение цифры напрямую зависит от её положения в числе. Например, число 01 обозначает единицу, 10 — десять.

Позиционные системы счисления позволяют легко производить арифметические расчёты

В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе. При этом система может накладывать ограничения на положение цифр, например, чтобы они были расположены в порядке убывания.

7 Двоичная система счисления. Запись чисел в двоичной системе счисления.

В двоичной системе счисления используются всего две цифры 0 и 1. Другими словами, двойка является основанием двоичной системы счисления. (Аналогично у десятичной системы основание 10.)

Чтобы научиться понимать числа в двоичной системе счисления, сначала рассмотрим, как формируются числа в привычной для нас десятичной системе счисления.

В десятичной системе счисления мы располагаем десятью знаками-цифрами (от 0 до 9). Когда счет достигает 9, то вводится новый разряд (десятки), а единицы обнуляются и счет начинается снова. После 19 разряд десятков увеличивается на 1, а единицы снова обнуляются. И так далее. Когда десятки доходят до 9, то потом появляется третий разряд – сотни.

Двоичная система счисления аналогична десятичной за исключением того, что в формировании числа участвуют всего лишь две знака-цифры: 0 и 1. Как только разряд достигает своего предела (т.е. единицы), появляется новый разряд, а старый обнуляется.

Попробуем считать в двоичной системе:

0 – это ноль

1 – это один (и это предел разряда)

10 – это два

11 – это три (и это снова предел)

100 – это четыре

101 – пять

110 – шесть

111 – семь и т.д.

Кодирование информации — урок. Информатика, 7 класс.

При кодировании текста каждому символу присваивается какое-то значение, например, порядковый номер.

 

Первый популярный компьютерный стандарт кодирования текста имеет название ASCII (American Standart Code for Information Interchange), в котором для кодирования каждого символа используются \(7\) бит.

\(7\)-ю битами можно закодировать \(128\) символов: большие и маленькие латинские буквы, цифры, знаки препинания, а так же специальные символы, например, «§».

  

Стандарту создавали разные варианты, дополняя код до \(8\) бит (\(256\) символов), чтобы можно было кодировать национальные символы, например, латышскую букву ā.

  

Но \(256\) символов не хватило, чтобы кодировать все символы разных алфавитов, поэтому создали новые стандарты. Один из самых популярных в наше время, это UNICODE. В котором каждый символ кодируют \(2\)-мя байтами, получается в итоге \(65536\) разных кодов.

Кодирования графических данных

Почти все созданные и обработанные изображения, хранящиеся в компьютере, можно поделить на две группы:
— растровая графика;
— векторная графика.

 

Растровая графика

 

Любое изображение созданное в растровой графике состоит их цветных точек. Эти точки называют пикселями (pixel). На рисунке можно видеть пример, где увеличена линия.

 

likne.png


Код пикселя содержит информацию о его цвете. Например, два цвета (чёрный — \(0\), белый — \(1\)) на предыдущей картинке:

 

liknekod.png

 

Для кодирования нецветных изображений обычно используют \(256\) оттенков серого, начиная от белого, заканчивая чёрным. Для кодирования всех цветов надо \(8\) битов (\(1\) байт).

Для кодирования цветных изображений обычно используют три цвета: красный, зелёный и синий. Цветной тон получается при смешивании этих трёх цветов.


triskrasas.png


 

Если каждый из трёх цветов кодировать в \(256\) тонов, тогда получается больше \(16.5\) миллионов разных цветовых тонов. Для данного рода кодирования надо 3⋅8=24 бита или \(3\) байта.

Для кодирования изображений можно использовать и меньшее количество битов, но тогда будет меньше цветовых тонов, и из-за этого качество изображения понизится.

Размер изображения можно посчитать, умножив его ширину на длину в пикселях. Например, изображение размером 200⋅100 пикселей, занимает \(60000\) байт.

 

Векторная графика

 

В векторной графике изображение состоит из разных объектов: линий, прямоугольников, окружностей и других фигур.

Кодирование звуков

Звуки появляются из-за колебаний воздуха. У звука есть две величины:
— амплитуда колебания, которая указывает на громкость звука;
— частота колебания, которая указывает на тональность звука.


Звук можно переделать в электрический сигнал, например, микрофоном.
Звук кодируют, после точного интервала времени измеряя размер сигнала и присваивая ему бинарную величину. Чем чаще проводятся эти измерения, тем лучше качество звука.

Пример:

На одном компакт диске, с объемом \(700\) Мб, может вместиться \(80\) минут звука CD качества.

Кодирование видео

Фильм состоит из кадров, которые быстро меняются. Кодированный фильм содержит информацию о размере кадра, используемых цветах, и количество кадров в секунду (обычно \(30\)), как и способ записи звука — каждому кадру отдельно или всему фильму сразу.

Кодирование информации. Коды. Системы кодирования

Для обмена информацией с другими людьми человек использует естественные и формальные языки. Представление информации с помощью какого-либо языка часто называют кодированием.

Кодирование — это процесс представления информации в виде кода.

Код - система условных знаков (символов), каждому из которых ставится в соответствие определенное значение.

Все множество символов, используемых для кодирования, называется алфавитом кодирования. Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и 1.

Код состоит из определенного количества знаков, т. е. имеет определенную длину.

Количество знаков в коде называется длиной кода.

В процессе обмена информацией между людьми часто приходится переходить от одной формы представления информации к другой. Так, в процессе чтения вслух производится переход от письменной формы представления информации к устной и, наоборот, в процессе диктанта или записи объяснения учителя происходит переход от устной формы к письменной. В процессе преобразования информации из одной формы представления в другую происходит перекодирование информации.

Перекодирование — это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы.

Информация может быть представлена в форме числа, текста, графики или звука.

Средством перекодирования служит таблица соответствия знаковых систем (таблица перекодировки), которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

Чаще всего кодированию подвергаются тексты на естественных языках. Существуют 3 основных способа кодирования текста:

1.     графический — с помощью специальных рисунков или значков;

2.     числовой — с помощью чисел;

3.     символьный — с помощью символов того же алфавита, что и исходный текст.

Полный набор символов, используемый для кодирования текста, называется алфавитом или азбукой.

Рассмотрим некоторые способы кодирования.

1. Кодированием информации с помощью букв русского алфавита. Суть этого способа заключается в том, чтобы каждую букву сообщения заменить ее номером в алфавите.

2. Флажковая азбука. При помощи этой азбуки осуществляется передача и прием сообщений между судами и кораблями в пределах прямой видимости. Здесь, каждой букве соответствует определенный флаг.

3. Азбука Морзе.

Информация кодируется тремя «буквами»:

·        длинный сигнал (тире),

·        короткий сигнал (точка),

·        отсутствие сигнала (пауза) для разделения букв.

Таким образом, кодирование сводится к использованию набора символов, расположенных в строго определенном порядке.

4. Шифр Цезаря. Этот шифр реализует следующее преобразование текста: каждая буква исходного текста заменяется третьей после нее буквой в алфавите, которая считается написанным по кругу.

5. Перевод чисел из одной системы счисления в другую.

Пусть требуется перевести двоичное число в десятичную систему счисления.

Чтобы осуществлять перевод из двоичной системы счисления в десятичную, следует для начала пронумеровать разряды исходного числа справа налево, начиная с нуля.

Запишем число в виде многочлена, состоящего из произведений цифр числа и соответствующей степени числа 2:

И вычислив по правилам десятичной арифметики, получили число 232.

Пусть теперь требуется перевести двоичное число в восьмеричную систему счисления. Для этого следует разбить это двоичное число на триады, начиная с младшего бита.

Если старшая триада не заполнена до конца, как в нашем случае, следует дописать в ее старшие разряды нули. После этого необходимо заменить двоичные триады, начиная с младшей, на числа, равные им в восьмеричной системе. Это числа: 4, 7, 6, 6, 4, 5, 5, 2.

Таким образом, наше двоичное число запишется в виде:

Аналогично поступаем при переводе чисел из двоичной системы счисления в шестнадцатеричную, но разбиение двоичного числа производим на тетрады. Для примера будем использовать то же двоичное число, что и при переводе в восьмеричную систему счисления.

Заменяя двоичные тетрады на их шестнадцатеричные значения, то есть на C, B, D, C, 6, 5, получим искомое шестнадцатеричное число:

А теперь давайте мы попробуем перевести число 158 из десятичной в двоичную систему счисления. Для этого нужно выполнить последовательное деление нацело числа 158 на основании новой системы счисления, то есть на 2. Получим:

Далее число 79 делим на 2. Аналогичные действия выполняем до тех пор, пока частное не станет равным единице.

Затем запишем остатки от деления в обратном порядке, заменив их цифрами новой системы счисления, т.е. получили число 11101000.

При переводе числа из шестнадцатеричной системы счисления в двоичную, необходимо только заменить каждую цифру шестнадцатеричного числа ее эквивалентом в двоичной системе счисления (используя таблицу соответствия). И не забываем, что каждое шестнадцатеричное число следует заменять двоичным, дополняя его до 4 разрядов (в сторону старших разрядов).

Пусть требуется перевести шестнадцатеричное число F1 в двоичное число. Воспользовавшись таблицей соответствия, получим:

F соответствуют четыре единицы в двоичной системе счисления, а 1 соответствует такая запись 0, 0, 0, 1 в двоичной системе счисления.

Итак, число F1 в двоичной системе счисления запишется так 11110001.

Пусть теперь нам нужно перевести число F1 из шестнадцатеричной системы счисления в восьмеричную. Обычно при таком переводе чисел вначале шестнадцатеричное число переводят в двоичное, затем разбивают его на триады, начиная с младшего бита, а потом заменяют триады соответствующими им эквивалентами в восьмеричной системе. В итоге у на получится, что исходному числу в восьмеричной системе счисления соответствует число 361.

 

Конспект «Кодирование и декодирование информации»

«Кодирование и декодирование информации»

Код ОГЭ: 1.2.2 Кодирование и декодирование информации.


Кодирование информации

■ Кодирование информации — процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки.

В процессах восприятия, передачи и хранения информации живыми организмами, человеком и техническими устройствами происходит кодирование информации. В этом случае информация, представленная в одной знаковой системе, преобразуется в другую. Каждый символ исходного алфавита представляется конечной последовательностью символов кодового алфавита. Эта результирующая последовательность называется информационным кодом (кодовым словом, или просто кодом).

Примерами кодов являются последовательность букв в тексте, цифр в числе, двоичный компьютерный код и др.

Код состоит из определенного количества знаков (имеет определенную длину), которое называется длиной кода. Например, текстовое сообщение состоит из определенного количества букв, число — из определенного количества цифр.

Преобразование знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы называется перекодированием.

При кодировании один символ исходного сообщения может заменяться одним или несколькими символами нового кода, и наоборот — несколько символов исходного сообщения могут быть заменены одним символом в новом коде. Примером такой замены служат китайские иероглифы, которые обозначают целые слова и понятия.

Кодирование может быть равномерным и неравномерным. При равномерном кодировании все символы заменяются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины (это затрудняет декодирование). Неравномерный код называют еще кодом переменной длины.

Примером неравномерного кодирования является код азбуки Морзе. Длительное время он использовался для передачи сообщений по телеграфу. Кодовый алфавит включал точку, тире и паузу. При передаче по телеграфу точка означала кратковременный сигнал, тире — сигнал в 3 раза длиннее. Между сигналами букв одного слова делалась пауза длительностью одной точки, между словами — длительностью трех точек, между предложениями — длительностью семи точек.

Вначале код Морзе был создан для букв английского алфавита, цифр и знаков препинания. Принцип этого кода заключался в том, что часто встречающиеся буквы кодировались более простыми сочетаниями точек и тире. Это делало код компактным. Позже код был разработан и для символов других алфавитов, включая русский.

Коды Морзе для некоторых букв.

Кодирование и декодирование

Чтобы избежать неоднозначности, код Морзе включает также паузы между кодами разных символов.

Декодирование информации

■ Декодирование — обратный процесс восстановления информации из закодированного представления.

В зависимости от системы кодирования информационный код может или не может быть декодирован однозначно. Равномерные коды всегда могут быть декодированы однозначно.

Для однозначного декодирования неравномерного кода важно, имеются ли в нем кодовые слова, которые являются одновременно началом других, более длинных кодовых слов.

Закодированное сообщение можно однозначно декодировать с начала, если выполняется условие Фано: никакое кодовое слово не является началом другого кодового слова.

Закодированное сообщение можно однозначно декодировать с конца, если выполняется обратное условие Фано: никакое кодовое слово не является окончанием другого кодового слова.

Неравномерные коды, для которых выполняется условие Фано, называются префиксными. Префиксный код — такой неравномерный код, в котором ни одно кодовое слово не является началом другого, более длинного слова. В таком случае кодовые слова можно записывать друг за другом без разделительного символа между ними.

Например, код Морзе не является префиксным — для него не выполняется условие Фано. Поэтому в кодовый алфавит Морзе, кроме точки и тире, входит также символ–разделитель — пауза длиной в тире. Без разделителя однозначно декодировать код Морзе в общем случае нельзя.


Конспект урока по информатике «Кодирование и декодирование информации».

Вернуться к Списку конспектов по информатике.

 

1.3. Система кодирования информации

Кодирование информации применяют для унификации формы представления данных, которые относятся кразличным типам, в целях автоматизации работы с информацией.

Кодирование – это выражение данных одного типа через данные другого типа. Например, естественные человеческие языки можно рассматривать как системы кодирования понятий для выражения мыслей посредством речи, к тому же и азбуки представляют собой системы кодирования компонентов языка с помощью графических символов.

В вычислительной технике применяется двоичное кодирование. Основой этой системы кодирования является представление данных через последовательность двух знаков: 0 и 1. Данные знаки называются двоичными цифрами (binary digit), или сокращенно bit (бит). Одним битом могут быть закодированы два понятия: 0 или 1 (да или нет, истина или ложь и т. п.). Двумя битами возможно выразить четыре различных понятия, а тремя – закодировать восемь различных значений.

Наименьшая единица кодирования информации в вычислительной технике после бита – байт. Его связь с битом отражает следующее отношение: 1 байт = 8 бит = 1 символ.

Обычно одним байтом кодируется один символ текстовой информации. Исходя из этого для текстовых документов размер в байтах соответствует лексическому объему в символах.

Более крупной единицей кодирования информации служит килобайт, связанный с байтом следующим соотношением: 1 Кб = 1024 байт.

Другими, более крупными, единицами кодирования информации являются символы, полученные с помощью добавления префиксов мега (Мб), гига (Гб), тера (Тб):

1 Мб = 1 048 580 байт;

1 Гб = 10 737 740 000 байт;

1 Тб = 1024 Гб.

Для кодирования двоичным кодом целого числа следует взять целое число и делить его пополам до тех пор, пока частное не будет равно единице. Совокупность остатков от каждого деления, которая записывается справа налево вместе с последним частным, и будет являться двоичным аналогом десятичного числа.

В процессе кодирования целых чисел от 0 до 255 достаточно использовать 8 разрядов двоичного кода (8 бит). Применение 16 бит позволяет закодировать целые числа от 0 до 65 535, а с помощью 24 бит – более 16,5 млн различных значений.

Для того чтобы закодировать действительные числа, применяют 80-разрядное кодирование. В этом случае число предварительно преобразовывают в нормализованную форму, например:

2,1427926 = 0,21427926 ? 101;

500 000 = 0,5 ? 106.

Первая часть закодированного числа носит название мантиссы, а вторая часть – характеристики. Основная часть из 80 бит отводится для хранения мантиссы, и некоторое фиксированное число разрядов отводится для хранения характеристики.

1.4. Кодирование текстовой информации

Текстовую информацию кодируют двоичным кодом через обозначение каждого символа алфавита определенным целым числом. С помощью восьми двоичных разрядов возможно закодировать 256 различных символов. Данного количества символов достаточно для выражения всех символов английского и русского алфавитов.

В первые годы развития компьютерной техники трудности кодирования текстовой информации были вызваны отсутствием необходимых стандартов кодирования. В настоящее время, напротив, существующие трудности связаны с множеством одновременно действующих и зачастую противоречивых стандартов.

Для английского языка, который является неофициальным международным средством общения, эти трудности были решены. Институт стандартизации США выработал и ввел в обращениесистему кодирования ASCII (American Standard Code for Information Interchange – стандартный код информационного обмена США).

Для кодировки русского алфавита были разработаны несколько вариантов кодировок:

1) Windows-1251 – введена компанией Microsoft; с учетом широкого распространения операционных систем (ОС) и других программных продуктов этой компании в Российской Федерации она нашла широкое распространение;

2) КОИ-8 (Код Обмена Информацией, восьмизначный) – другая популярная кодировка российского алфавита, распространенная в компьютерных сетях на территории Российской Федерации и в российском секторе Интернет;

3) ISO (International Standard Organization – Международный институт стандартизации) – международный стандарт кодирования символов русского языка. На практике эта кодировка используется редко.

Ограниченный набор кодов (256) создает трудности для разработчиков единой системы кодирования текстовой информации. Вследствие этого было предложено кодировать символы не 8-разрядными двоичными числами, а числами с большим разрядом, что вызвало расширение диапазона возможных значений кодов. Система 16-разрядного кодирования символов называетсяуниверсальной – UNICODE. Шестнадцать разрядов позволяет обеспечить уникальные коды для 65 536 символов, что вполне достаточно для размещения в одной таблице символов большинства языков.

Несмотря на простоту предложенного подхода, практический переход на данную систему кодировки очень долго не мог осуществиться из-за недостатков ресурсов средств вычислительной техники, так как в системе кодирования UNICODE все текстовые документы становятся автоматически вдвое больше. В конце 1990-х гг. технические средства достигли необходимого уровня, начался постепенный перевод документов и программных средств на систему кодирования UNICODE.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *