Р. Уэлз МЕРА СУБЪЕКТИВНОЙ ИНФОРМАЦИИ * [93]
1. Цель статьи. Можно ожидать, что теория информации будет иметь три аспекта, если к ней применить деление семиотики, предложенное Чарлзом Моррисом. Синтаксическая часть будет иметь дело со знаками (символами), рассматриваемыми в отвлечении от их значений; семантическая часть должна иметь дело со знаками qua значимыми, но таким образом, что она будет отвлекаться от тех индивидуумов, или существ (не принимать их во внимание), которые используют эти знаки; и, наконец, прагматическая часть принимает во внимание как потребителей (интерпретантов), так и носителей знака и их значения и, следовательно, завершает дело семиотики.
До последнего времени теория информации была синтаксической. Указывая на то, что «часто... сообщения имеют значение», Шеннон[94] затем отмечает, что «эти семантические аспекты связи не имеют отношения к техническим проблемам». Основной вклад в семантическую теорию информации сделали Карнап и Бар-Хиллел[95]. Они применили логику Карнапа (включая и его трактовку
вероятности) к теории информации. Прагматическая часть мало разрабатывалась; в теории информации, в том виде как она развивалась до сих пор, «мы не проводим различия между полезной и бесполезной информацией... Идея «ценности» говорит о возможном ее использовании живым наблюдателем. Это выходит за рамки нашей теории»[96]. К,этому вопросу имеют отношения работы некоторых экономистов[97].
В настоящей статье намечаются в общих чертах два положения: первое в области прагматики, второе в области семантики. В прагматической части рассматривается «субъективная информация», благодаря которой одно предложение, даже логически истинное, может быть субъективно более информативным (важным, ценным, эвристичным), чем другое; в семантической части рассматривается функция предложений, называемая «информативностью».
Ввиду того что возможности синтактики в некотором а смысле более ограниченны и бедны по сравнению с возможностями семантики, а возможности семантики в свою очередь более бедны по сравнению с возможностями прагматики, то хотелось бы знать, насколько третья может быть представляема второй, а вторая — первой. В настоящей статье обсуждается как раз этот вопрос. Информативность служит семантической моделью или репрезентацией субъективной информации. Дело в том, что каноническая форма прагматического утверждения о субъективной информации имеет вид: «А считает, что предложение Sі более информативно, чем предложение S2»; и если просто опустить фразу: «А считает, что», то можно получить семантическое утверждение. Полученное семантическое утверждение будет, если оно истинно, истинным a priori.
2. Подход Карнапа — Бар-Хиллела. Основная идея теории информации заключается в том, что объем информации в сообщении следует рассматривать как функцию
числа возможных альтернативных сообщений. Основная идея Карнапа и Бар-Хиллела заключается в необходимости работы с семантическим аналогом информации как с функцией числа возможных условий, при которых сообщение было бы истинным.
Для того чтобы реализовать эту основную идею, они истолковывают «возможные условия» посредством предложенного Виттгенштейном термина «описание», которое Карнап положил в основу своих последних работ по логике.Число элементов множества описаний зависит от того языка, на каком даны эти описания. Некоторые теоретические трудности, возникающие для всех языков, за исключением очень простых, нас не интересуют (Кемени[98] указал, как разрешить некоторые из них), поскольку оказывается, что для нашей цели подход на основе описания является в корне неверным.
Подход, основанный на описании (то есть подход, который является общим для всего многоообразия моделей описания), формализует ряд философских идей «Логикофилософского трактата» Виттгенштейна: 1) Всякая необходимая истина является логической, а всякая случайная истина — эмпирической.
2) Логические истины можно рассматривать как истины, которые сохраняют свое значение во всех возможных положениях вещей (или во всех возможных мирах). 3) «Все предложения логики говорят одно и то же. А именно ничего» (5.43; ср. 5.142 и 6.11). Все три идеи включены в теоремы (Т4—2а, Тб—lb, Тб—4Ь, Т7—8Ь, ср. R5—2*) Карнапа и Бар-Хиллела, которые придают числовое значение нуля всем L-истинным предложениям.3. Необходимость альтернативы для подхода, основанного на описании состояния. Карнап[99] перечисляет три «требования для экспликата», первое из которых является требованием «сходства с экспликандой». Мейтс[100] в сущности уточняет это требование, предлагая положить в основу условия адекватности, которым должен удовлетворять успешный экспликат. Его предложение может быть использовано дальше, поскольку оно подсказывает нам, как отличать различимые экспликанды в тех случаях, где требуется специальная помощь. Например, объяснения вероятности, данные Карнапом, основаны на гипотезе, что существует две различимые экспликанды под одним названием «вероятность», которые следует эксплицировать. Однако у Карнапа нет развитой методологии для подкрепления этой гипотезы, если не считать обычных методов проверки гипотез по их следствиям. В данной статье я выдвигаю ту гипотезу, что существует по крайней мере две различимые экспликанды под одним названием «информация», но кроме обычных методов проверки гипотез я использую еще и метод «условий адекватности» и предлагаю следующее.
Смысл слов «объем информации» (а отсюда и слова «информация») таков, что не все логически истинные предложения имеют один и тот же объем информации.
Это условие адекватности служит критерием различения по крайней мере двух смыслов: смысла, который требует этого условия, и смысла, который его не требует. Карнап и Бар-Хиллел объяснили смысл «информации», который его не требует; я предлагаю назвать это «фактической (или «случайной», или «а posteriori») информацией».
Задача настоящей статьи состоит в том, чтобы подготовиться к объяснению смысла, который требует этого условия.Если понимать «информацию» в этом смысле, то мы будем наблюдать в сфере a priori различные случаи, аналогичные существующим в сфере эмпирического факта. Например, нам известно, что эмпирические предложения могут отличаться по содержанию информации (information- content, 1C), степени информации (information-degree, ID) и объему информации (information-amount, IA); оказывается, что те же особенности присущи и предложениям, которые являются истинными или ложными а priori. Вероятное следствие предложения S может нести информацию, превышающую информацию S; то же самое может иметь место и с необходимым следствием. Как (Карнап и Бар-Хиллел, стр. 30—31, §9) конъюнкция двух предложений о фактах, так и конъюнкция двух предложе
но ний a priori может дать значительно больше информации* чем каждое из них, взятое в отдельности.
При изложении теории информации принято связывать информацию с неожиданностью: чем предложение более информативно, тем оно более неожиданно, если оно передается в синтаксических вариантах или если оно является истинным (в семантических вариантах). Например, если S' является истинным L, то IA (S) = 0, то есть данное предложение полностью согласуется с учением Виттгенштейна о том, что в логике не существует неожиданностей, а также ошибок (5.473) или экспериментов (6.2331). Виттгенштейн мог иметь в виду только то, что имел в виду Аристотель («Метафизика», А.З: 983а, строки 12—21) в своем высказывании, гласящем, что хотя «у всех и вызывает удивление, что некоторые вещи нельзя измерить самою малой мерой», все же «ничему бы так не удивился человек, сведущий в геометрии, как тому, что соизмеримой оказалась диагональ». Но существует и другой вид неожиданности, который никогда не уменьшается или не исчезает, или если не неожиданности, то информативности, важности, значимости или чего-нибудь в этом роде. Например, все соглашаются, что теорема Пифагора является более информативным предложением, чем «7+5=12», хотя оба они L- истинны.
То же самое относится ко всем системам предложений. Грамматику языка можно рассматривать как систему предложений; для того чтобы грамматика считалась «хорошей» или «удовлетворительной», она, в соответствии со взглядами многих грамматистов, должна быть не толька эмпирически истинной, но также «эвристичной» и «нетривиальной». Что касается меня, то я бы сказал, что формальные изложения Карнапа и Бар-Хиллела, хотя их легко можно было бы выразить на формализованном метаязыке как L-истины, являются в значительной степени информативными.То обстоятельство, что априорные истины могут различаться по информативности, вытекает также из другого факта. Этот факт состоит в том, что мы судим об открытиях и о первооткрывателях, подходя к некоторым из них как к более важным, а к другим как к второстепенным. Главным открытием в сфере a priori будет открытие важной истины (например, теоремы Гёделя), то есть открытие того, что такое-то и такое-то важное предложение является истинным. Гением же, то есть великим первооткрывателем* будет тот, кто сделал это очень важное открытие, то есть нашел очень важные (высокоинформативные) истинные предложения.
Существует и третий аргумент в пользу признания переменной информативности в сфере a priori; это то, что фигурирует в «рациональности» (rationale) исследования. Математическая трактовка Пирса, рассматривающего эту «рациональность»[101], принимает во внимание две переменные: стоимость и полезность. При более детальном рассмотрении, которое сможет адекватно объяснить «рациональность» как в сфере a priori, так и в сфере a posteriori, полезность должна быть расчленена на ее компоненты, из которых одной будет вероятность успеха, а другой — информативность различных возможных результатов.
4. Мера субъективной информации. Принципы, изложенные в предыдущем параграфе, представляют собой эмпирические утверждения об определенных суждениях, выраженных или подразумеваемых человеком. Эти суждения можно было бы собрать и обработать при помощи уже известных методов[102].
Их структура была бы последовательной (сравнительной), подобно структуре сравнительных суждений о вероятности a posteriori и; на эту последовательную структуру можно было бы наложить метрику, произвольно во всяком случае и возможно на основе некоторого подходяще выбранного отношения соединения j (Гемпель, стр. 63—65), например, в таком виде: fn(xjy)=m(x)+m(y). (Очевидный кандидат, на первый взгляд,— логическая конъюнкция — не может служить этой цели; мы хотим доказать, что объем информации не является аддитивным относительно логической конъюнкции. Аддитивность определяется у Гемпеля, стр. 75).Принципиальный интерес в эмпирическом исследовании вышеприведенного типа будет представлять степень согласия различных экспертов, чьи суждения собраны.
Одна из причин для наложения метрики, при условии, что она будет наложена на последовательные суждения каждого эксперта до сравнивания с суждениями других экспертов, состоит в том, что метрика делает сравнение суждений возможным и легким. Метод, подобный «коэффициенту корреляции ранга» Кендалля [103], который метрически сравнивает просто последовательные сравнения, возможен, но не так прост. Не известно, как повлиял бы выбор самих экспертов на степень согласия. Было бы интересно изучить суждения группы экспертов, которые, будучи однажды избранными, оценили бы самих себя и друг друга по своим знаниям и значению таким образом, чтобы при конечном синтезе суждений можно было бы приписать различную весомость суждениям различных экспертов.
Многие согласились бы с Гемпелем (стр. 62) в том, что «использование „человеческих инструментов" сравнения не свободно от недостатков... Согласие сонаблюдателей часто является далеко не полным..; вместе с тем даже один и тот же наблюдатель может дать противоречивые ответы. К тому же, по-видимому, большинство понятий, определяемых при помощи соотнесения с показаниями „человеческих инструментов", имеет весьма ограниченное теоретическое значение, поскольку они не могут быть основой для точных и исчерпывающих обобщений». Однако по поводу этого заключения можно сделать несколько замечаний.
Во-первых, может случиться, что согласие между наблюдателями и согласие сонаблюдателей будет заметно улучшено некоторыми мерами предосторожности, (а) Нет оснований считать, что суждения должны выноситься поспешно и в уединении, как это часто практикуется в психологических экспериментах; нет оснований считать, что эксперты не должны совещаться друг с другом и обдумывать свои суждения на протяжении многих месяцев или лет, прежде чем сообщить о них. (б) В частности, каждый эксперт мог бы использовать некоторые методы проверки непротиворечивости своих суждений, убеждаясь, например[104], что они никогда не нарушают транзитивности отношения «является более информативным, чем».
Во-вгорых, если даже не все эксперты придерживаются одного и того же мнения, то все-таки иногда они могут составить относительно небольшое число групп, представляющих различные точки зрения, таким образом, что члены каждой группы в основном будут согласны друг с другом. И тогда может случиться, что две группы расходятся в мнениях не по основным вопросам, а только в деталях.
В-третьих, все собранные и синтезированные суждения можно использовать не один раз. Можно считать, что они имеют эмпирическое значение. Но их также можно считать и ценными в эвристическом отношении данными для теоретика a priori, который поставил бы себе целью построение чистой теории, допускающей эмпирическое применение (интерпретацию), удовлетворительно согласующееся с этими данными.
Исследования, которые были здесь намечены, связаны с «субъективной информацией», то есть с информацией в таком виде, как она представляется различным субъектам. Их суждения могут быть или не быть субъективными в общераспространенном смысле, а именно неустойчивыми, непостоянными и не согласующимися друг с другом. Следовательно, можно было бы без ущерба для дела назвать наш предмет «прагматической информацией». Однако среди философов и ученых широко распространено мнение, что, поскольку суждение не является просто субъективным в этом уничижительном смысле, его можно заменить суждением, которое также не будет являться прагматическим. Если привлечь пример из теории вероятности — области, тесно связанной с нашей,— то критика субъективной теории вероятности побуждает нас к тому, чтобы вероятность определялась или устанавливалась не на основании той степени уверенности, которую имеет человек, а на основании той, которую он должен иметь14. Принудительная сила иногда включается в понятие «идеальный верующий», то есть верующий, убеждения которого имеют как раз ту силу, которую они должны иметь. Но в действительности вероятность является семантической; ее прагматическая видимость (через ее отношение к наблюдателю) является иллюзорной, поскольку этот фактор может быть без ущерба для дела опущен.
Теперь я перехожу к описанию чисто семантического и априорного рассмотрения информативности.
5. Чисто семантическая модель: информативность.
Здесь будет изложено несколько утверждений, которые, как мне кажется, целесообразно включить в строгую систему. IA(S) является (метрическим) объемом информативности (informativeness-amount) предложения S; 1C(S) является (качественным) содержанием информативности (informativeness-content) предложения S. Переменные S (с индексами или без них) пробегают по всем необходимо- -истинным предложениям. Мы ограничиваемся только истинными предложениями, потому что надеемся избежать проблемы смешения объемов информативности IA ложных предложений (и, в частности, необходимо ложных предложений) с объемами информативности IA истинных предложений (например, при приписывании первым отрицательных значений). Ограничиться только необходимо- -истинными предложениями мы вынуждены для того, чтобы избежать проблемы смешения объемов информативности IA необходимо-истинных предложений с объемами информативности IA случайно-истинных предложений. Может случиться, конечно,что кто-то захочет произвести одно или оба эти смешения или, наоборот, оставить два или четыре «промежутка», не связанных друг с другом. Следующие утверждения нельзя воспринимать как застывшие аксиомы. Они слишком не полны и слишком избыточны, чтобы быть удовлетворительными с этой точки зрения. Они скорее являются примерами того, что должно было бы быть включено в число теорем адекватно формализованной и аксиоматизированной экспликации информативности.
1. 0