Тарифы Услуги Сим-карты

Семантическая информация в информатике. Семантическая мера информации. Смотреть что такое "Семантическая информация" в других словарях

Ты - не раб!
Закрытый образовательный курс для детей элиты: "Истинное обустройство мира".
http://noslave.org

Материал из Википедии - свободной энциклопедии

Семантическая информация - смысловой аспект информации, отражающий отношение между формой сообщения и его смысловым содержанием.

История

Формирование понятия семантической информации

Современные теории семантической информации

Теория Флориди

В своей работе 2004 года Лучано Флориди с первой строки обрушивается на теорию Бар Хиллела и Карнапа: «„Треугольник имеет четыре стороны“: согласно классической теории семантической информации в этом противоречии заключено больше смыслового содержания, чем в условно истинном утверждении „Земля имеет только одну Луну“ » . Флориди назвал это «парадоксом Бар-Хиллела-Карнапа ». Решение этого парадокса он видит в том, что количество семантической информации в сообщениях должно зависеть не только от заключенного в них смыслового содержания, но и от значения истинности этих сообщений. Флориди ввел понятие условно ложного предложения (contingently false sentence ), представляющего собой конъюнкцию двух его составных частей, одна из которых истинная, а вторая - ложная. Примером такого предложения может служить высказывание: «Луна вращается вокруг Земли и внутри она полая». Такое предложение одновременно несет информацию (тем, кто не знает, что Луна вращается вокруг Земли) и дезинформацию (в обычной жизни часто приходится встречаться с подобным - дезинформацию легче продвигать, если она дополняется некоторой долей информации).

С точки зрения классической логики условно ложное предложение является просто ложным и несет только дезинформацию. Однако приведенный пример показывает, что на самом деле это не так. Первоначальная теория Бар-Хиллела и Карнапа не в состоянии решить эту антиномию . Поэтому Флориди отверг её (как «слабую» теорию) и создал свою собственную - «сильную». Он отказался от использования логических вероятностей и заявил, что теория семантической информации не должна быть похожей на теорию Шеннона . В его собственной интерпретации количество семантической информации в сообщении определяется степенью соответствия этого сообщения ситуации (то есть тому, что происходит в данном месте и в данное время). Несоответствие возникает либо в результате бессодержательности сообщения, либо в результате его неточности. В своей теории Флориди непосредственно не использует понятие дезинформации, вместо этого он вводит понятие степени неточности условно ложных предложений. Степень неточности в условно ложном предложении texvc равна:

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): -v(s)=-{\frac{f(s)}{l(s)}} ,

где Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): f(s) - число ложных атомарных выражений в Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s ; Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): l(s) - общее число атомарных предложений в Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s . Для определения истинности атомарных предложений требуется принять принцип априорного всезнания. Степень бессодержательности истинного предложения Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s рассчитывается по формуле:

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): +v(s)={\frac{m(s)}{n}} ,

где Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): m(s) - число миров универсума, в которых Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s истинно; Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): n - общее число миров универсума (заметим, что, согласно этому определению, величина Невозможно разобрать выражение (Выполняемый файл texvc в точности равна величине логической вероятности Невозможно разобрать выражение (Выполняемый файл texvc ). Далее Флориди вводит понятие функции степени информативности:

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): i(s)=1-v^2(s) .

Количество семантической информации Невозможно разобрать выражение (Выполняемый файл texvc в сообщении Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s равно определенному интегралу от функции степени информативности Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): i(s) :

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): i^*(s)={\frac{3}{2}}\int\limits_{v(s)}^{1}(1-x^2)\mathrm dx=1-{\frac{3v(s)}{2}}+{\frac{v^3(s)}{2}} .

Несмотря на все отличия между классической теорией и теорией Флориди, в них есть нечто общее. Если Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s является истинным предложением, то величина Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): +v(s) равна величине логической вероятности Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): q(s) . Мера Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): i^*(s) подобна мере Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{cont}(s) , но в отличие от последней, является нелинейной функцией Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): v(s) . К сожалению, в теории Флориди нет ничего похожего на меру Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{inf}(s) , обладающую замечательным свойством (*) для логически независимых предложений.

Теория семантической информации и дезинформации

Поднятая Флориди проблема может быть решена в рамках теории, основанной на логических вероятностях. Необходимо отметить, что к началу текущего века у некоторых ученых сформировалось скептическое отношение к индуктивной логике Карнапа . Однако современные математики смогли изменить ситуацию, модифицировав эту теорию . Благодаря этому интерес к логическим вероятностям вновь возродился.

В работе предлагается модифицировать классическую теорию семантической информации, включив в неё понятие дезинформации, которую несет ложное сообщение. В новой теории, как и в теории Флориди, рассматривается множество различных ситуаций (точек пространства-времени). Одно и то же предложение языка может быть истинным в одной ситуации и ложным в другой. Поскольку получатель сообщений не может быть застрахован от ошибок при оценке их истинности, количество семантической информации оценивается отдельно с точки зрения получателя и с точки зрения всезнающего эксперта.

В каждой конкретной ситуации истинное сообщение несет только информацию, а абсолютно ложное - одну только дезинформацию. Условно ложное предложение Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s рассматривается как конъюнкция : Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s_T\land s_F , где Невозможно разобрать выражение (Выполняемый файл texvc - истинная часть сообщения, Невозможно разобрать выражение (Выполняемый файл texvc - ложная часть сообщения. При этом требуется, чтобы Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s_T и Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s_F были логически независимыми (это нужно, в частности, для того, чтобы противоречие не оказалось условно ложным предложением). Тогда ненормализованные меры количества информации Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{in}_E(s) и количества дезинформации Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{mi}_E(s) Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s с точки зрения эксперта определяются следующим образом:

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{in}_E(s)=\mbox{cont}(s_T) , Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{mi}_E(s)=\mbox{cont}(s_F) .

Индекс «Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): E », которым помечены символы «Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{in} » и «Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{mi} » в формулах, указывает на то, что рассматриваются количества информации и дезинформации с точки зрения эксперта. Нормализованные меры количества семантической информации Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{inf}_E(s) и дезинформации Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{mis}_E(s) в условно ложном предложении Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s с точки зрения эксперта:

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{inf}_E(s)=\log_2{\frac{1}{1-\mbox{cont}(s_T)}}=\log_2{\frac{1}{q(s_T)}} , Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{mis}_E(s)=\log_2{\frac{1}{1-\mbox{cont}(s_F)}}=\log_2{\frac{1}{q(s_F)}} .

Противоречие с точки зрения эксперта несет нулевое количество информации и бесконечное количество дезинформации. Таким образом решается парадокс Бар-Хиллела-Карнапа. Бесконечное количество дезинформации объясняется тем, что, если бы противоречие вдруг кому-то показалось истиной, то мир изменился бы для него до неузнаваемости. Двумя словами это не описать. Предположим, что получатель информации имеет условно ложные знания Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): e , эквивалентные конъюнкции: Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): e_T\land e_F , где Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): e_T - истинная часть его знаний, Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): e_F - заблуждения. Тогда с точки зрения эксперта, получив условно ложное сообщение Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s , адресат реально имеет семантическую информацию и дезинформацию в следующих количествах:

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{inf}_E(s/e)=\log_2{\frac{q(e_T)}{q(s_T\land e_T)}}=\log_2{\frac{1}{q(s_T/e_T)}} , Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{mis}_E(s/e)=\log_2{\frac{q(e_F)}{q(s_F\land e_F)}}=\log_2{\frac{1}{q(s_F/e_F)}} .

Если получатель воспринимает Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s как истинное предложение и конъюнкция Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): s\land e не является противоречием, то с его точки зрения он получил следующее количество информации:

Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): \mbox{inf}_R(s/e)=\log_2{\frac{1}{q(s/e)}}=\mbox{inf}_E(s/e)+\mbox{mis}_E(s/e) .

Индекс «Невозможно разобрать выражение (Выполняемый файл texvc не найден; См. math/README - справку по настройке.): R » обозначает оценку адресата. Очевидно, что точное количество информации (и дезинформации) в пришедшем сообщении может определить только эксперт, а получатель способен лишь на более-менее точные оценки.

Напишите отзыв о статье "Семантическая информация"

Примечания

Отрывок, характеризующий Семантическая информация

Удар получился ужасным!.. Закричав диким криком «Нет!!!», я потеряла сознание...

* Примечание: прошу не путать (!!!) с греческим комплексом монастырей Мэтэора в Каламбаке, Греция. Мэтэора по-гречески означает «висящие в воздухе», что полностью соответствует потрясающему виду монастырей, как розовые грибы выросших на высочайших верхушках необычных гор. Первый монастырь был построен примерно в 900 году. А между 12 и 16 столетиями их было уже 24. До наших дней «дожили» всего лишь шесть монастырей, которые до сих пор потрясают воображение туристов.
Правда, туристам не известна одна весьма забавная деталь... В Мэтэоре существует ещё один монастырь, в который «любопытные» не допускаются... Он был построен (и дал начало остальным) одним одарённым фанатиком, учившимся когда-то в настоящей Мэтэоре и изгнанным из неё. Обозлившийся на весь мир, он решил построить «свою Мэтэору», чтобы собирать таких же «оскорблённых», как он, и вести свою уединённую жизнь. Как ему это удалось – неизвестно. Но с тех пор в его Мэтэоре начали собираться на тайные встречи масоны. Что происходит раз в году и по сей день.
Монастыри: Гранд Мэтэорон (большой Мэтэорон); Руссано; Агиос Николас; Агиа Триос; Агиас Стефанос; Варлаам расположены на очень близком расстоянии друг от друга.

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства со способностью пользователя принимать поступившие сообщения. Для этого используется понятие тезаурус пользователя.

Тезаурус – это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I c воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан нарисунке 5. Рассмотрим два предельных случая, когда количество семантической информации I c равно 0 :

· При S p » 0 пользователь не воспринимает, не понимает поступающую информацию;

· При S p ® ¥ пользователь все знает, и поступающая информация ему не нужна.


S p opt S p

Рисунок 5.

Зависимость количества семантической информации, воспринимаемой

потребителем, от его тезауруса I c = f(S P)

Максимальное количество семантической информации I c потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S P (S P = S P opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и тоже сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

Относительной мерой количества семантической информации может служить коэффициент содержательности С , который определяется как отношение количества семантической информации к ее объему:

Прагматическая мера информации

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера величина также относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Пример. В экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:



где: I n b (g) – ценность информационного сообщения b для системы управления g,

П(g) априорный ожидаемый экономический эффект функционирования системы управления g,

П(g /b) – ожидаемый эффект функционирования системы g при условии, что для управления будет использована информация, содержащиеся в сообщении b.

Для сопоставления введенные меры информации представим в таблице 2.

Таблица 2. Единицы измерения информации и примеры

Мера информации Единицы измерения Примеры (для компьютерной области)
Синтаксическая: шенноновский подход; компьютерный подход. Степень уменьшения неопределенности. Единицы представления информации. Вероятность события. Бит, байт, Кбайт, и т.д.
Семантическая Тезаурус Экономические показатели Пакет прикладных программ, персональный компьютер, компьютерные сети и т.д. Рентабельность, производительность, коэффициент амортизации и т.д.
Прагматическая Ценность использования Емкость памяти, производительность компьютера, скорость передачи данных и т.д. Денежное выражение. Время обработки информации и принятия решений.

Системы счисления

С незапамятных времен людям приходилось выполнять элементарные подсчеты, связанные с определением количества животных в стаде, числа убитых и раненых воинов, размера добычи охотника и т. п. Наиболее древние числительные – один, два, пять, десять, двадцать – обязаны своим происхождением самым естественным счетным приспособлениям – пальцам рук и ног.

Английский исследователь первобытной культуры Э. Тейлор описывает происхождение вычислительных терминов на примере языка племени таманакс Ориноко. Для обозначения «пятерки» у них применялось сочетание, означающее в переводе «целая рука». Число «шесть» представлялось как «один с другой руки». И так до числа «десять», звучавшего как «обе руки». Затем в ход шли пальцы ног – «один с ноги» (11), «один с другой ноги» (16), «один человек» (20). Для больших величин приходилось прибегать к аналогичным «разрядам» другого человека – «один с руки другого человека» (21), «два человека» (40) и т. д.



Аналогичная техника использования «пятерок» хорошо прослеживается на письменности индейцев майя. Их жрецы в своих календарных расчетах применяли следующие цифры и производные от них числа.

В древнем Египте привились более близкие нам числовые компоненты – единицы, десятки, сотни и тысячи.

Подобный способ счета заложил основу для аддитивных (от слова складывать – add) систем счисления, в которых число представляется в виде суммы стандартных слагаемых.

Так называемая римская система счисления представляет собой несколько более усложненную аддитивную модель:

1=I 5=V 10=X 50=L 100=C 500=D 1000=M 1972=MCMLXXII

Если меньшая числовая компонента находится справа, то она увеличивает значение предыдущего слагаемого (VI=V+I=6, XII+X+I+I=12), а если слева, то вместо прибавления приходится вычитать (IV=-1+V=4, IX=-1+X=9). И хотя запись чисел в римской системе не так уж сложна, но попробуйте перемножить CCXLVII на MMCDXI или хотя бы сложить эти два числа. А в десятичной системе такая же задача (247*2411) решается за несколько секунд.

Следующий шаг в математическом развитии человечества связан с появлением мультипликативных систем счисления. Теперь каждая цифра множится на некий весовой коэффициент, зависящий от нахождения цифры в числе. Одна из наиболее ранних попыток такого рода предпринималась жрецами майя, которые для записи больших чисел использовали формулу:

Здесь - одна из описанных выше цифр, принадлежащая диапазону . Выбор столь странных весовых коэффициентов объясняется тем, что жрецы делили год на 18 месяцев, каждый из которых насчитывал по 20 дней. В расшифрованных документах было обнаружено довольно большое число:

Появлению современной десятичной системы счисления предшествовали различные счетные приспособления, которыми люди пользовались для ускорения рыночных операций и более сложных рыночных расчетов. К ним относятся и примитивные кучки из камушков разного размера, и более удобные приспособления из доски, разделенные на отсеки со счетными шариками (абак). Кстати, латинское слово для обозначения счета «calculare» произошло от «calculus» – камень.

Одна и та же цифра в разных позициях числа имеет, естественно, разный вес.

Десятичная система, обязанная своим происхождением первобытным средствам счета, далеко не единственная, придуманная людьми. Отголоски системы с основанием 60 можно обнаружить в наших представлениях об измерении времени и угловых величин. В Нидерландах сохранилась тенденция к счету дюжинами. Однако десятичная система доминирует в мире людей. А вот в мире компьютеров с момента появления первой ЭВМ используется только двоичная система. За всю историю информатики известна единственная попытка построить ЭВМ, работающую в троичной системе счисления, она была сконструирована в МГУ и называлась «Сетунь».

Система счисления - это совокупность правил и при­емов записи чисел с помощью набора цифровых знаков (алфавита). Количество цифровых знаков называют ос­нованием системы счисления.

Различают два типа систем счисления:

позиционные, когда значение каждой цифры числа определяется ее местом (позицией) в записи числа;

непозиционные , когда значение цифры в числе не зависит от ее места в записи числа.

Примером непозиционной системы счисления являет­ся римская: XI, IV, XV и т.д. Примером позиционной системы счисления можно назвать десятичную систему, используемую повседневно.

Десятичная система счисления пришла в Европу из Индии, где она появилась не позднее VI века н.э. В этой системе 10 цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, но информацию несет не только цифра, но и место, на котором цифра стоит (то есть ее позиция). В десятичной системе счисления особую роль играют число 10 и его степени: 10, 100, 1000 и т.д. Самая правая цифра числа показывает число единиц, вторая справа - число десятков, следующая - число сотен и т.д.

Двоичная система счисления . В этой системе всего две цифры - 0 и 1. Особую роль здесь играет число 2 и его степени: 2, 4, 8 и т.д. Самая правая цифра числа показывает число единиц, следующая цифра - число двоек, следующая - число четверок и т.д. Двоичная система счисления позволяет закодировать любое натуральное число - представить его в виде последовательности нулей и единиц. В двоичном виде можно представлять не только числа, но и любую другую информацию: тексты, картинки, фильмы и аудиозаписи. Инженеров двоичное кодирование привлекает тем, что легко реализуется технически.

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера (предложена Ю. И. Шрейдером), которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя .

Тезаурус - это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации 1 С, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 1.5. Рассмотрим два предельных случая, когда количество семантической информации 1 С равно 0:

  • при S p ->0 пользователь не воспринимает, не понимает поступающую информацию;
  • при S p ->1 пользователь все знает, и поступающая информация ему не нужна.

Рис. 1.5.

Максимальное количество семантической информации / с потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S p (S p = S popt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения. Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного. Относительной мерой количества семантической информации может служить коэффициент содержательности С, рассмотренный выше.

Прагматический (аксиологический) подход к информации базируется на анализе ее ценности, с точки зрения потребителя. Например, информация, имеющая несомненную ценность для биолога, будет иметь ценность, близкую к нулевой, для программиста. Ценность информации связывают со временем, поскольку с течением времени она стареет и ценность ее, а следовательно, и «количество» уменьшаются. Таким образом, прагматический подход оценивает содержательный аспект информации. Он имеет особое значение при использовании информации для управления, поскольку ее количество тесно связано с эффективностью управления в системе.

Прагматическая мера информации определяет полезность информации (ценность) для достижения пользователем поставленной цепи. Эта мера - также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.

Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Алгоритмический подход связан с желанием внедрения универсальной меры информации. Количественная характеристика, отражающая сложность (размер) программы и позволяющая произвести какое- либо сообщение, была предложена А. Н. Колмогоровым.

Так как существуют разные способы задания и реализации алгоритма с использованием различных вычислительных машин и языков программирования, то для определенности задается некоторая конкретная машина, например машина Тьюринга. В этом случае в качестве количественной характеристики сообщения можно взять минимальное число внутренних состояний машины, требующихся для воспроизведения данного сообщения.

Разные подходы к оценке количества информации заставляют, с одной стороны, использовать разнотипные единицы информации для характеристики различных информационных процессов, а с другой - увязывать эти единицы между собой как на логическом, так и на физическом уровнях. Например, процесс передачи информации, измеряемой в одних единицах, сопрягается с процессом хранения информации, где она измеряется в других единицах, и т.д., а поэтому выбор единицы информации является весьма актуальной задачей.

В табл. 1.3 сопоставлены введенные меры информации.

Таблица 1.3

Сопоставление мер информации

По информации не рассматривался смысл (значение) поступающей информации, а в ряде случаев это принципиально, Ю.А. Шрейдер предложил «Семантическую теорию информации».

Так «…результаты анализа или оценки одного и того же произведения литературы или искусства, полученные разными критиками или в разное время, часто не совпадают между собой даже по основным, принципиальным вопросам. Всё это показывает, что восприятие эстетическое не является абсолютным, зависящим лишь от того, что воспринимается, от «информации», заключённой в объекте восприятия, от самого художественного произведения.

Поскольку в процессе восприятия участвует приёмник, воспринимающий эстетическое сообщение, то результаты анализа и оценка сообщения существенно зависят от свойств самого приёмника.

В связи с этим нельзя не сказать о некоторых подходах кибернетики к вопросам эстетического восприятия, которые, в частности, могут способствовать объективной оценке художественного произведения. Естественно, что при такой постановке задачи эти подходы должны учитывать семантическую (смысловую, или содержательную) сторону произведений, а также способность приёмника извлечь из произведения «художественную», эстетическую информацию.

Некоторые аспекты теории информации имеют непосредственное приложение к исследованию восприятия художественных произведений. Так, в последнее время за рубежом и в нашей стране проводятся исследования, связанные с разработкой семантических аспектов теории информации. В общих чертах один из таких аспектов, разрабатываемых Ю. А. Шрейдером , заключается в следующем.

Поскольку информация I, которую получает приёмник из сообщения Т , существенно зависит от свойств самого приемника, вводится в рассмотрение понятие тезауруса θ приёмника.

В словарной практике тезаурусом […] принято называть одноязычный ассоциативный словарь, в котором указаны различные смысловые связи между словами. Тезаурус θ , как и всякий справочник, отражает сведения, накопленные к определённому моменту времени некоторым индивидуумом (приёмником). В частности, он характеризует способность этого индивидуума воспринимать те или другие сообщения.

Информация I , получаемая приёмником, характеризуется как принимаемым сообщением Т , так и степенью изменения тезауруса θ, т. е. I = I (Т, θ).

Иначе говоря, количество информации I (Т, θ), содержащееся в сообщении Т относительно тезауруса θ, характеризуется степенью изменения тезауруса под действием воспринимаемого сообщения.

Очевидно, что из одного и того же сообщения разные приёмники (с разными тезаурусами) извлекают неодинаковую информацию. Вследствие неподготовленности данный тезаурус вообще может не воспринять некоторые (непонятные ему) сообщения. Последние для данного приёмника не несут никакой информации (приемник получил нулевую информацию), и в этом случае его тезаурус не изменился.

Но нулевую информацию приёмник получает также и в случае, если он воспринимает уже известное сообщение. В обоих этих случаях тезаурус приёмника не изменяется и I (Т, θ) = θ .

Таким образом, семантическая теория информации признаёт, что большую роль при восприятии сообщения играет «настройка», «предпрограммирование», подготовленность приёмника.

Поэтому из некоторого данного сообщения примитивный тезаурус информации не извлекает, развитый тезаурус «понимает» сообщение и получает максимальную информацию, а перенасыщенный тезаурус также информации не получает из-за слишком хорошей подготовленности. Так, например, одно и то же «сообщение» - учебник по высшей математике дошкольнику не даёт никакой информации (тезаурус неподготовлен), студенту-математику даёт максимум информации, а профессору-математику опять-таки не даёт никакой информации (тезаурус перенасыщен).

Аналогично и для восприятия художественного произведения (в частности, музыкального) приемник должен обладать некоторым тезаурусом в данном виде искусства. Художественная, или эстетическая, информация, содержащаяся в данном произведении, отлична от нуля лишь для некоторого диапазона тезаурусов…».