Реферат современные способы кодирования информации в вычислительной технике. Презентация «Методы кодирования информации

Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.

Двоичное кодирование - один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

ASCII - [сокр. англ. American Standard Code for Information Interchange - Американский стандартный код для обмена информацией] Набор из 128 кодов символов для букв, цифр, управляющих и других знаков, используемый во многих вычислительных системах.

Для кодирования текстовой информации принят международный стандарт ASCII (American Standard Code for Information Interchange), в кодовой таблице которого зарезервировано 128 7-ми разрядных кодов для кодирования:

- Символов латинского алфавита
- Цифр
- Знаков препинания
- Математических символов

Добавление 8-го разряда позволяет увеличить количество кодов таблицы ASCII до 255. Коды от 128 до 255 представляют собой расширение таблицы ASCII. Эти коды в таблице ASCII использованы для кодирования некоторых символов, отличающихся от латинского алфавита, и встречающихся в языках с письменностью, основанной на латинском алфавите, - немецком, французском, испанском и др. Кроме этого, часть кодов использована для кодирования символов псевдографики, которые можно использовать, например, для оформления в тексте различных рамок и текстовых таблиц.

Для кодирования символов национальных алфавитов используется расширение кодовой таблицы ASCII, то есть 8-ми разрядные коды от 128 до 255.

В языках использующих кириллический алфавит, в том числе русском, пришлось полностью менять вторую половину таблицы ASCII, приспосабливая ее под кириллический алфавит. Но отсутствие согласованных стандартов привело к появлению различных кодовых таблиц для кодирования русскоязычных текстов, среди которых

- Альтернативная кодовая таблица CP-866
- Международный стандарт ISO 8859
- Кодовая таблица фирмы Microsoft CP-1251 (кодировка Windows)
- Кодовая таблица, применяемая в ОС Unix KOI 8-r

КОИ-8 (код обмена информацией, 8 битов), KOI8 -- восьмибитовый стандарт кодирования символов в информатике. Разработан для кодирования букв кириллических алфавитов. Существует также семибитовая версия кодировки -- КОИ-7. КОИ-7 и КОИ-8 описаны в ГОСТ 19768-74 (сейчас недействителен).

Разработчики КОИ-8 поместили символы русского алфавита в верхней части расширенной таблицы ASCII таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читабельный» текст, хотя он и написан латинскими символами. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.

ISO 8859-5. Проблема с дефицитом уникальных символов для других языков решилась достаточно быстро и относительно безболезненно - стандартная 7-битная кодовая таблица ASCII обрела еще один, 8-й полноправный бит - под эгидой Международной организации по стандартизации (ISO) появилось целое семейство стандартов ISO 8859-X. Дополнительный бит дал возможность использовать теперь уже 256 символов, причем младшая половина кодовой таблицы (символы с кодами 0-127) полностью повторяет ASCII, а старшая - содержит уникальные элементы национальных кодировок. Такая организация национальных кодовых таблиц позволяет правильно отображать и обрабатывать латинские буквы, цифры и знаки препинания на любом компьютере, независимо от его языковых настроек. В дружной семье кодировок ISO нашлось место и для нашей кириллицы, получившей кодовое обозначение ISO 8859-5. Характерной ее особенностью является строго алфавитное размещение в ней русских букв, очень удобное для корректной сортировки записей в базах данных. Как выяснилось чуть позже, дитя оказалось мертворожденным: ISO 8859-5 конфликтовала с псевдографикой в набравшей к тому времени силу DOS, а позже не нашла она понимания и у авторов Windows.

Windows-1251 -- набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Пользуется довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах Windows в 1990-1991 гг. совместно представителями «Параграфа», «Диалога» и российского отделения Microsoft. Первоначальный вариант кодировки сильно отличался от представленного ниже в таблице (в частности, там было значительное число «белых пятен»).

Windows-1251 выгодно отличается от других 8_битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только значок ударения); она также содержит все символы для близких к русскому языку языков: украинского, белорусского, сербского и болгарского.

Имеет два недостатка:

- строчная буква «я» имеет код 0xFF (255 в десятичной системе). Она является «виновницей» ряда неожиданных проблем в программах без поддержки чистого 8-го бита, а также (гораздо более частый случай) использующих этот код как служебный (в CP437 он обозначает «неразрывный пробел», в Windows-1252 -- y, оба варианта практически не используются; число же -1, в дополнительном коде длиной 8 бит представляющееся числом 255, часто используется в программировании как специальное значение, например, индикатор конца файла EOF часто представляется значением -1).
- отсутствуют символы псевдографики, имеющиеся в CP866 и KOI8 (хотя для самих Windows, для которых она предназначена, в них не было нужды, это делало несовместимость двух использовавшихся в них кодировок заметнее).

Урок "Кодирование инфомации".

Информацию друг другу мы передаем в устной и письменной форме, а также в форме жестов и знаков.

Знаки могут иметь различную физическую природу . Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов ).

Виды информации

Информация, как объект классифицируется по видам. Таких классификаций несколько. Каждая наука вводит свою классификацию. Для информатики главным является то, каким образом информация вводится/выводится, обрабатывается, хранится, используя средства вычислительной техники. Поэтому в информатике принята следующая классификация видов информации:

Аналоговая – непрерывная (воспринимается человеком)		Дискретная – скачкообразная (воспринимается ВТ)

визуальная аудиальная тактильная обонятельная вкусовая

*Примеры:* скрипка телевизор телефон картина в музее графики функций		*Примеры:* фортепьяно монитор музыкальный центр мобильный телефон

Формы представления информации

Так как аналоговую информацию человек воспринимает с помощью своих органов чувств, то он стремится зафиксировать ее таким образом, чтобы она стала понятна другим. При этом одна и та же информация может быть представлена в разных формах.

В любом виде информация для нас выражает сведения о ком-то или о чем-то. Она отражает происходящее или происшедшее в нашем мире, например: что мы делали вчера или будем делать завтра, как будет выглядеть выпускное платье или место будущей работы. Но при этом информация обязательно должна получить некоторую форму, наиболее удобную для восприятия:

· текстов, рисунков, фотографий, чертежей;

· жестов и мимики;

· запахов и вкусовых ощущений;

· радиоволн;

· электрических и нервных импульсов;

· магнитных записей;

· хромосом

Получение информации - это, в конечном счете, получение фактов, сведений и данных о свойствах, структуре или взаимодействии объектов и явлений окружающего нас мира.

Язык как знаковая система

В процессе развития человеческого общества люди выработали большое число языков. Среди них язык жестов и мимики, язык рисунков и чертежей, язык музыки и язык математики, разговорный язык, алгоритмический язык и т. д.

Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), то есть информация представляется с помощью естественных языков.

Примеры алфавитов: В основе русского языка лежит кириллица , содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов ).

Последовательности символов алфавита в соответствии с правилами грамматики образуют основные объекты языка - слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом . Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически.

Схема передачи информации через письменность

УСТНАЯ РЕЧЬ

Письмо

ТЕКСТ

Чтение

УСТНАЯ РЕЧЬ

КОДИРОВАНИЕ ДЕКОДИРОВАНИЕ

Кодирование информации

Общая схема обмена информацией

Источник информации

Кодирующее устройство

Передача информации

Декодирующее устройство

Получатель информации

Кодирование текстовой информации

Языки представления информации
*Естественные:* Английский, французский, …			*Формальные:* Математики, программирования, ноты, …
Кодирование информации
Цели кодирования
засекречивание информации	быстрый способ записи	передача по техническим каналам связи		выполнение математических вычислений
*Шифрование*	*Стенография*	*Телеграфный код*		*Системы счисления*
Алгоритмы криптографии	Один знак – слово или сочетание букв	Код Морзе	Код Бодо	Для человека: десятичная	Для ПК: двоичная

Существует много способов кодирования, например

Азбука Морзе:

Стенография (от греч. στενός - узкий, тесный и γράφειν - писать) - способ письма посредством особых знаков и целого ряда сокращений, дающий возможность быстро записывать устную речь. Скорость стенографического письма превосходит скорость обычного в 4-7 раз.

Так как выбор значков для стенографии в основном произвольный, то из сочетаний различных значков образовалось бесчисленное множество стенографических систем, каждая из которых имеет свои достоинства и недостатки.

Искусство стенографии существовало уже, как можно заключить по некоторым данным, у древних египтян , где условным знаком записывались речи фараонов ; от египтян это искусство перешло к грекам и римлянам , у которых имелись скорописцы. 5 декабря 63 г. до н. э. в Древнем Риме состоялось первое известное в истории применение стенографии.

В некоторых случаях возникает потребность засекречивания документа или текста. В этом случае текст шифруется. В давние времена зашифрованный текст назывался тайнописью.

Шифрование - способ преобразования открытой информации в закрытую и обратно. Применяется для хранения важной информации в ненадёжных источниках или передачи её по незащищённым каналам связи .

Шифрование – это тоже кодирование, но с засекреченным методом, известным только адресату и источнику. Методами шифрования занимается наука криптография .

Рассмотрим в качестве примера кодирования соответствие цифрового и штрихового кодов товара. Такие коды имеются на каждом товаре и позволяют полностью идентифицировать товар (страну и фирму производителя, тип товара и штриховой коды товара.

Знакам цифрового кода (цифрам) соответствуют группы знаков штрихового кода (узкие и широкие штрихи, а также размеры промежутков между ними).

Для человека удобен цифровой код, а для автоматизированного учета и штриховой код, который считывается с помощью узкого светового луча и подвергается последующей обработке в компьютерных бухгалтерских системах учета.

Домашнее задание - придумайте или вспомните какую-либо информацию и представьте ее в разных формах, создать схему:

Создание новой мелодии

Свойства информации

Информация обладает следующими свойствами:

достоверность
полнота
точность
ценность
своевременность
понятность
доступность
краткость и т. д.

4) Классификация - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

1. Информацию можно подразделить по форме представления на 2 вида:
- дискретная форма представления информации- аналоговая или непрерывная форма представления информации

2. По области возникновения можно выделить информацию:
- элементарную- биологическую- социальную

3. По способу передачи и восприятия различают следующие виды информации:
- визуальную- аудиальную- тактильную- органолептическую- машинную

4. Информацию, создаваемую и используемую человеком, по общественному назначению можно разбить на три вида:
- личную- массовую- специальную

5. По способам кодирования выделяют следующие типы информации:
- символьную- текстовую- графическую.

5) Содержательный подход к измерению информации. Сообщение – информативный поток, который в процессе передачи информации поступает к приемнику. Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными Информация - знания человека? сообщение должно быть информативно. Если сообщение не информативно, то количество информации с точки зрения человека = 0. (Пример: вузовский учебник по высшей математике содержит знания, но они не доступны 1-класснику)

Алфавитный подход к измерению информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход - объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения. Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере. Поскольку 256=2 8 , то 1символ несет в тексте 8 бит информации.

Вероятностный подход к измерения информации. Все события происходят с различной вероятностью, но зависимость между вероятностью событий и количеством информации, полученной при совершении того или иного события можно выразить формулой которую в 1948 году предложил Шеннон.

6) Количество информации – в теории информации это количество информации в одном случайном объекте относительно другого

Количество информации можно рассматривать как меру уменьшения неопределенности знания при получении информационных сообщений.

При всем многообразии подходов к определению понятия информации, с позиции измерения информации выделяют два из них: определение К. Шеннона, применяемое в математической теории информации (содержательный подход), и определение А. Н. Колмогорова, применяемое в отраслях информатики, связанных с использованием компьютеров (алфавитный подход).

Содержательный подход. Согласно Шеннону, информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации. По Шеннону, информация - уменьшение неопределенности наших знаний.

Но если число исходов не зависит от суждений людей (случай бросания кубика или монеты), то информация о наступлении одного из возможных исходов является объективной.

Если сообщение уменьшило неопределенность знаний ровно в два раза, то говорят, что сообщение несет 1 бит информации.

1 бит - объем информации такого сообщения, которое уменьшает неопределенность знания в два раза.

Алфавитный подход. Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита.

Алфавит - упорядоченный набор символов, используемый для кодирования сообщений на некотором языке.

I – количество информации

N - количество разных событий.

Обратная формула N=2 I

7) Как уже было сказано, основная единица измерения информации - бит. 8 бит составляют 1 байт.

Наряду с байтами для измерения количества информации используются более крупные единицы:

1 Кбайт (один килобайт) = 210 байт = 1024 байта;

1 Мбайт (один мегабайт) = 210 Кбайт = 1024 Кбайта;

1 Гбайт (один гигабайт) = 210 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тб) = 1024 Гбайта = 240 байта,

1 Петабайт (Пб) = 1024 Тбайта = 250 байта.

1 байт = 8 бит;

1 Килобайт (Кбайт) = 2 10 байт

1 МегаБайт (Мбайт) = 2 10 Кбайт или 2 20 байт

1 Гигабайт (Гбайт) = 2 10 Мбайт или 2 30 байт

1 Терабайт (Тбайт) = 2 10 Гбайт или 2 40 байт

9) 2 - двоичная (в дискретной математике, информатике, программировании);
3 - троичная;
8 - восьмеричная;
10 - десятичная (используется повсеместно);
12 - двенадцатеричная (счёт дюжинами);
13 - тринадцатеричная;
16 - шестнадцатеричная (используется в программировании, информатике);
60 - шестидесятеричная (единицы измерения времени, измерение углов и, в частности, координат, долготы и широты).

9) Система счисле́ния - символический метод записи чисел, представление чисел с помощью письменных знаков.

Система счисления:

· даёт представления множества чисел (целых и/или вещественных);

· даёт каждому числу уникальное представление (или, по крайней мере, стандартное представление);

· отражает алгебраическую и арифметическую структуру чисел.

10) сложение, вычитание, деление, умножение недесятичных чисел.

11) это перевод из 1 системы счисления в другую

Способы кодирования информации.

Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Код - (1) правило, описывающее соответствие знаков или их сочетаний одного алфавита знакам или их сочетаниям другого алфавита; - (2) знаки вторичного алфавита, используемые для представления знаков или их сочетаний первичного алфавита.

Кодирование - перевод информации, представленной посредством первичного алфавита, в последовательность кодов.

Декодирование - операция, обратная кодированию, т.е. восстановление информации в первичном алфавите по полученной последовательности кодов.

Операции кодирования и декодирования называются обратимыми, если их последовательное применение обеспечивает возврат к исходной информации без каких-либо ее потерь.

13) Двоичная система – основа кодирования информации для ЭВМ

14) Существуют два способа представления чисел в памяти ЭВМ. Они называются так: форма с фиксированной точкой и форма с плавающей точкой. Форма с фиксированной точкой применяется к целым числам, форма с плавающей точкой - к вещественным числам (целым и дробным). Под точкой здесь подразумевается знак-разделитель целой и дробной части числа.

15) Таким образом, кодирование предшествует передаче и хранению информации. При этом, как указывалось ранее, хранение связано с фиксацией некоторого состояния носителя информации, а передача - с изменением состояния с течением времени (т.е. процессом). Эти состояния или сигналы будем называть элементарными сигналами - именно их совокупность и составляет вторичный алфавит.

Без технических сторон передачи и хранения сообщения (т.е. того, каким образом фактически реализованы передача-прием последовательности сигналов или фиксация состояний), математическая постановка задачи кодирования, дается следующим образом.

По типу линий связи: проводные; кабельные; оптико-волоконные;

линии электропередачи; радиоканалы и т.д.

2. По характеру сигналов: непрерывные; дискретные; дискретно-непрерывные (сигналы на входе системы дискретные, а на выходе непрерывные, и наоборот).

3. По помехозащищенности: каналы без помех; с помехами.

18) Или короче: алгоритм – это строго определенная последовательность действий, необходимых для решения данной задачи

19) На практике распространены следующие формы представления алгоритмов:

словесная (запись на естественном языке);
графическая (изображения из графических символов);
псевдокоды (полуформализованные описания алгоритмов на условном алгоритмическом языке, включающие как элементы языка программирования, так и фразы естественного языка, общепринятые математические обозначения и др.);
программная (тексты на языках программирования).

20) Сжатие информации - это процесс преобразования информации, хранящейся в файле, в результате которого уменьшается ее избыточность, соответственно, требуется меньший объем Памяти для хранения.

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т. д.

Архивация (упаковка) - помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

22) Код - набор символов (условных обозначений) дли представления информации. Кодирование - процесс представления информации в виде кода.

В процессе развития человечество пришло к осознанию необходимости хранить и передавать на расстояния ту или иную информацию. В последнем случае требовалось её преобразование в сигналы. Этот процесс называется кодированием данных. Текстовая информация, а также графические изображения при этом могут преобразоваться в числа. О том, каким образом это можно сделать, расскажет наша статья.

Передача информации на расстояние

фельдъегерско-почтовая;
акустическая (например, посредством громкоговорителя);
на основе того или иного способа электросвязи (проводная, радио, оптическая, радиорелейная, спутниковая, оптико-волоконная).

Наиболее распространенными на данный момент являются системы передачи последнего типа. Однако для их использования требуется предварительно применить тот или иной способ кодирования информации. С помощью чисел в привычном для современного человека десятичном исчислении сделать это крайне сложно.

Шифрование

Двоичная система счисления

На заре компьютерной эры ученые были озабочены поисками устройства, которое бы позволило максимально просто представлять числа в ЭВМ. Вопрос разрешился, когда Клод Шенон предложил использовать двоичную систему счисления. Она была известна с 17 века, и для ее реализации требовалось устройство с 2 устойчивыми состояниями, соответствующими логической «1» и логическому «0». Их на тот момент было известно предостаточно - от сердечника, который мог быть либо намагниченным, либо размагниченным, до транзистора, способного находиться или в открытом, или в закрытом состоянии.

Представление цветных картинок

Способ кодирования информации с помощью чисел для таких изображений реализуется несколько сложнее. С этой целью предварительно требуется декомпозиция картинки на 3 основных цвета (зеленый, красный и синий), так как в результате их смешения в определенных пропорциях можно получить любой оттенок, воспринимаемый человеческим глазом. Такой способ кодирования картинки с помощью чисел с использованием 24 двоичных разрядов называется RGB, или полноцветным (True Color).

Если же речь идет о полиграфии, то используется система CMYK. Она основана на идее о том, что каждую из основных компонент RGB можно поставить в соответствие с цветом, дополняющим её до белого. Ими являются голубой, пурпурный и желтый. Хотя их достаточно, с целью снижения полиграфических расходов, добавляют и четвертую компоненту — черную. Таким образом, для представления графики в системе CMYK требуется 32 двоичных разряда, а сам режим принято называть полноцветным.

Представление звуков

На вопрос о том, есть ли для этого способ кодирования информации с помощью чисел, ответ должен быть положительным. Однако на данный момент такие методы не считаются совершенными. К их числу относятся:

Метод FM. Он основан на разложении любого сложного звука на последовательность элементарных гармонических сигналов разных частот, которые можно описать кодом.
Таблично-волновой метод. В заранее составленных таблицах хранят сэмплы — образцы звуков для различных музыкальных инструментов. Числовые коды выражают тип и номер модели инструмента, высоту тона, интенсивность и продолжительность звука и пр.

Теперь вы знаете, что двоичное кодирование — один из распространенных способов представления информации, который сыграл огромную роль в развитии компьютерной техники.

Кодирование информации

Код - система условных знаков (символов) для передачи, обработки и хранения информации (сообщения).

Кодирование - процесс представления информации (сообщения) в виде кода.

Все множество символов, используемых для кодирования, называется алфавитом кодирования . Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и 1.

Научные основы кодирования были описаны К.Шенноном, который исследовал процессы передачи информации по техническим каналам связи (теория связи , теория кодирования ). При таком подходе кодирование понимается в более узком смысле: как переход от представления информации в одной символьной системе к представлению в другой символьной системе . Например, преобразование письменного русского текста в код азбуки Морзе для передачи его по телеграфной связи или радиосвязи. Такое кодирование связано с потребностью приспособить код к используемым техническим средствам работы с информацией (см. “Передача информации” 2).

Декодирование - процесс обратного преобразования кода к форме исходной символьной системы , т.е. получение исходного сообщения. Например: перевод с азбуки Морзе в письменный текст на русском языке.

В более широком смысле декодирование - это процесс восстановления содержания закодированного сообщения. При таком подходе процесс записи текста с помощью русского алфавита можно рассматривать в качестве кодирования, а его чтение - это декодирование.

Цели кодирования и способы кодирования

Способ кодирования одного и того же сообщения может быть разным. Например, русский текст мы привыкли записывать с помощью русского алфавита. Но то же самое можно сделать, используя английский алфавит. Иногда так приходится поступать, посылая SMS по мобильному телефону, на котором нет русских букв, или отправляя электронное письмо на русском языке из-за границы, если на компьютере нет русифицированного программного обеспечения. Например, фразу: “Здравствуй, дорогой Саша!” приходится писать так: “Zdravstvui, dorogoi Sasha!”.

Существуют и другие способы кодирования речи. Например, стенография -быстрый способ записи устной речи . Ею владеют лишь немногие специально обученные люди - стенографисты. Стенографист успевает записывать текст синхронно с речью говорящего человека. В стенограмме один значок обозначал целое слово или словосочетание. Расшифровать (декодировать) стенограмму может только стенографист.

Приведенные примеры иллюстрируют следующее важное правило: для кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств. Если надо записать текст в темпе речи - используем стенографию; если надо передать текст за границу - используем английский алфавит; если надо представить текст в виде, понятном для грамотного русского человека, - записываем его по правилам грамматики русского языка.

Еще одно важное обстоятельство: выбор способа кодирования информации может быть связан с предполагаемым способом ее обработки . Покажем это на примере представления чисел - количественной информации. Используя русский алфавит, можно записать число “тридцать пять”. Используя же алфавит арабской десятичной системы счисления, пишем: “35”. Второй способ не только короче первого, но и удобнее для выполнения вычислений. Какая запись удобнее для выполнения расчетов: “тридцать пять умножить на сто двадцать семь” или “35 х 127”? Очевидно - вторая.

Однако если важно сохранить число без искажения, то его лучше записать в текстовой форме. Например, в денежных документах часто сумму записывают в текстовой форме: “триста семьдесят пять руб.” вместо “375 руб.”. Во втором случае искажение одной цифры изменит все значение. При использовании текстовой формы даже грамматические ошибки могут не изменить смысла. Например, малограмотный человек написал: “Тристо семдесять пят руб.”. Однако смысл сохранился.

В некоторых случаях возникает потребность засекречивания текста сообщения или документа, для того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа . В таком случае секретный текст шифруется. В давние времена шифрование называлось тайнописью.Шифрование представляет собой процесс превращения открытого текста в зашифрованный, адешифрование - процесс обратного преобразования, при котором восстанавливается исходный текст. Шифрование - это тоже кодирование, но с засекреченным методом, известным только источнику и адресату. Методами шифрования занимается наука под названиемкриптография (см. “Криптография” 2).

История технических способов кодирования информации

С появлением технических средств хранения и передачи информации возникли новые идеи и приемы кодирования. Первым техническим средством передачи информации на расстояние стал телеграф, изобретенный в 1837 году американцем Сэмюэлем Морзе. Телеграфное сообщение - это последовательность электрических сигналов, передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату. Эти технические обстоятельства привели С.Морзе к идее использования всего двух видов сигналов - короткого и длинного - для кодирования сообщения, передаваемого по линиям телеграфной связи.

Такой способ кодирования получил название азбуки Морзе. В ней каждая буква алфавита кодируется последовательностью коротких сигналов (точек) и длинных сигналов (тире). Буквы отделяются друг от друга паузами - отсутствием сигналов.

Самым знаменитым телеграфным сообщением является сигнал бедствия “SOS” (S ave O ur S ouls - спасите наши души). Вот как он выглядит в коде азбуки Морзе, применяемом к английскому алфавиту:

–––

Три точки (буква S), три тире (буква О), три точки (буква S). Две паузы отделяют буквы друг от друга.

На рисунке показана азбука Морзе применительно к русскому алфавиту. Специальных знаков препинания не было. Их записывали словами: “тчк” - точка, “зпт” - запятая и т.п.

Характерной особенностью азбуки Морзе является переменная длина кода разных букв , поэтому код Морзе называютнеравномерным кодом . Буквы, которые встречаются в тексте чаще, имеют более короткий код, чем редкие буквы. Например, код буквы “Е” - одна точка, а код твердого знака состоит из шести знаков. Это сделано для того, чтобы сократить длину всего сообщения. Но из-за переменной длины кода букв возникает проблема отделения букв друг от друга в тексте. Поэтому приходится для разделения использовать паузу (пропуск). Следовательно, телеграфный алфавит Морзе является троичным, т.к. в нем используется три знака: точка, тире, пропуск.

Обработка информации

Обработка информации - процесс планомерного изменения содержания или формы представления информации .

Обработка информации производится в соответствии с определенными правилами некоторым субъектом или объектом (например, человеком или автоматическим устройством). Будем его называть исполнителем обработки информации .

Исполнитель обработки, взаимодействуя с внешней средой, получает из нее входную информацию , которая подвергается обработке. Результатом обработки являетсявыходная информация , передаваемая внешней среде. Таким образом, внешняя среда выступает в качестве источника входной информации и потребителя выходной информации.

Обработка информации происходит по определенным правилам, известным исполнителю. Правила обработки, представляющие собой описание последовательности отдельных шагов обработки, называются алгоритмом обработки информации.

Исполнитель обработки должен иметь в своем составе обрабатывающий блок, который назовем процессором, и блок памяти, в котором сохраняются как обрабатываемая информация, так и правила обработки (алгоритм). Все сказанное схематически представлено на рисунке.

Схема обработки информации

Пример. Ученик, решая задачу на уроке, осуществляет обработку информации. Внешней средой для него является обстановка урока. Входной информацией - условие задачи, которое сообщает учитель, ведущий урок. Ученик запоминает условие задачи. Для облегчения запоминания он может использовать записи в тетрадь - внешнюю память. Из объяснения учителя он узнал (запомнил) способ решения задачи. Процессор - это мыслительный аппарат ученика, применяя который для решения задачи, он получает ответ - выходную информацию.

Схема, представленная на рисунке, - это общая схема обработки информации, не зависящая от того, кто (или что) является исполнителем обработки: живой организм или техническая система. Именно такая схема реализована техническими средствами в компьютере. Поэтому можно сказать, что компьютер является технической моделью “живой” системы обработки информации.

Входная информация, представленная в символьной форме (знаки, буквы, цифры, сигналы), называетсявходными данными . В результате обработки исполнителем получаютсявыходные данные . Входные и выходные данные могут представлять собой множество величин - отдельных элементов данных. Если обработка заключается в математических вычислениях, то входные и выходные данные - это множества чисел. На следующем рисункеX : {x 1,x 2, …,xn } обозначает множество входных данных, аY : {y 1,y 2, …,ym } - множество выходных данных:

Схема обработки данных

Обработка заключается в преобразовании множества X в множествоY :

P (X )Y

Здесь Р обозначает правила обработки, которыми пользуется исполнитель. Если исполнителем обработки информации является человек, то правила обработки, по которым он действует, не всегда формальны и однозначны. Человек часто действует творчески, не формально. Даже одинаковые математические задачи он может решать разными способами. Работа журналиста, ученого, переводчика и других специалистов - это творческая работа с информацией, которая выполняется ими не по формальным правилам.

Для обозначения формализованных правил, определяющих последовательность шагов обработки информации, в информатике используется понятие алгоритма (см. “Алгоритм” 2). С понятием алгоритма в математике ассоциируется известный способ вычисления наибольшего общего делителя (НОД) двух натуральных чисел, который называют алгоритм Евклида. В словесной форме его можно описать так:

1. Если два числа равны между собой, то за НОД принять их общее значение, иначе перейти к выполнению пункта 2.

2. Если числа разные, то большее из них заменить на разность большего и меньшего из чисел. Вернуться к выполнению пункта 1.

Здесь входными данными являются два натуральных числа - х 1 их 2. РезультатY - их наибольший общий делитель. Правило (Р ) есть алгоритм Евклида:

Алгоритм Евклида (х 1,х 2)Y

Такой формализованный алгоритм легко запрограммировать для современного компьютера. Компьютер является универсальным исполнителем обработки данных. Формализованный алгоритм обработки представляется в виде программы, размещаемой в памяти компьютера. Для компьютера правила обработки (Р ) - это программа.