- Процесс дискретизации информации
- Двоичное кодирование
- Универсальность двоичного кодирования
- Равномерные и неравномерные коды
- знать определения: дискретизация, алфавит, мощность алфавита, двоичный код, равномерный и неравномерный двоичный код
- знать общую схему перевода символов произвольного алфавита в двоичный код
- уметь выявлять взаимосвязи между разрядностью двоичного кода и возможным количеством кодовых комбинаций
- уметь определять разрядность двоичного кода
- знать принцип универсальности двоичного кода
- Что такое знак и знаковая система?
- Какие формы представления информации существуют?
- Какой по форме представления является информация на французском языке, на языке химических символов, музыкальные произведения П. И. Чайковского?
- Что называют кодированием?
Процесс дискретизации информации
Образное представление информации всегда непрерывно, примером может быть картина, написанная художником. Та информация, которая представлена с помощью некоторой знаковой системы, будет дискретна, то есть её структура состоит из отдельных значений. Информация на естественном и формальных языках является дискретной.
Ежедневно человек сталкивается с процессом преобразования информации из одной формы представления в другую. Зачитывая вслух новости или инструкцию, информация преобразуется из дискретной формы (текста) в непрерывную (звук). И наоборот, если информация записывается под диктовку, то говорят о преобразовании из непрерывной формы представления в дискретную.
Но такое преобразование характерно и для компьютерных технологий. В них особое место занимают методы и способы преобразования информации из непрерывной формы в дискретную.
Дискретизация информации — это процесс, в котором информацию преобразуют из непрерывной формы представления в дискретную.
Пример 1
Преобразуйте из непрерывной формы в дискретную форму данные о температуре (рис. 1).
Решение
Таблица 1. Дискретная форма
Число месяца
|
1
|
19
|
t
|
0 °С
|
−15 °С
|
Кривая показывает, насколько сильно происходило изменение температуры воздуха в течение месяца. Данный график позволяет узнать и записать показание термометра в любой из дней. Так, к примеру, первого числа температура воздуха была 0 °С, а девятнадцатого — −15 °С (таб. 1).
Двоичное кодирование
Естественный и формальный языки позволяют представить некоторую информацию в дискретной форме. Любой язык имеет алфавит.
Алфавит — это набор символов, букв, знаков препинания, цифр, скобок и других символов, которые используются для представления информации (пробел также включён в алфавит).
Полное число символов алфавита называют мощностью алфавита.
Двоичный алфавит — это алфавит, состоящий из двух символов.
Двоичное кодирование — это представление информации с помощью двоичного алфавита. Информация в этом случае будет иметь двоичный код.
Двоичные символы (0, 1) берут в заданном алфавитном порядке и размещают слева направо. Двоичный код читают сверху вниз.
Таблица 2. Цепочки из двух двоичных символов
Порядковый номер символа
|
1
|
2
|
3
|
4
|
Двузначный двоичный код
|
00
|
01
|
10
|
11
|
Цепочки из двух двоичных символов — четыре различных символа произвольного алфавита (таб. 2).
Таблица 3. Цепочки из трёх двоичных символов
Порядковый номер символа
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
Трёхзначный двоичный код
|
000
|
001
|
010
|
011
|
100
|
101
|
110
|
111
|
Цепочки из трёх двоичных символов — восемь различных символов произвольного алфавита (таб. 3).
Таким же образом получается четырёхразрядный двоичный код, при котором получается 16 кодовых комбинаций, пятиразрядный — 32 комбинации и т. д.
Разрядностью двоичного кода называют длину двоичной цепочки. Иными словами, количество символов в двоичном коде.
Выделим закономерность:
и т. д.
или
,
где N — количество кодовых комбинаций, i — разрядность двоичного кода.
Универсальность двоичного кодирования. Равномерные и неравномерные коды
Любая информация — тексты, числа, формулы, изображения, звуки — могут быть представлены в виде двоичного кода, который широко применяется в компьютерной технике.
В приведённых выше примерах длина кода в каждой таблице была одинаковой. В таком случае коды называют равномерными. Если же в кодовых комбинациях различное число символов, то говорят о неравномерных кодах. Примером неравномерного кода является азбука Морзе.
Контрольные вопросы
1. Для чего нужен процесс дискретизации информации?
2. Что такое алфавит? Что такое мощность алфавита? Какова мощность русского алфавита и дополнительных символов (цифр, знаков препинания, скобок и пробела)?
3. Поясните универсальность двоичного кода.
4. От разведчика было получено сообщение: 001001110110100.
В этом сообщении зашифрован пароль — последовательность русских букв. В пароле использовались только буквы А, Б, К, Л, О, С. Каждая буква кодировалась двоичным слово по таблице ниже.
Расшифруйте сообщение.
Вопрос 4
ОБЛАКО