<<
>>

Джозеф Гринберг ОПРЕДЕЛЕНИЕ МЕРЫ РАЗНОЯЗЫЧИЯ

1. При взгляде на карту распределения языков на доста­точно обширном пространстве бросается в глаза несходство отдельных территорий: мы видим там и участки чрезвы­чайно пестрые, вроде Новой Гвинеи или Нубийских Хол­мов в Судане, и сравнительно однородные, такие, как Восточные Леса Северной Америки до завоевания или же современные Соединенные Штаты, и, наконец, все промежу­точные градации.

В настоящей статье мы рассмотрим вопрос о выработке оценок, которые помогли бы в объективной форме выразить субъективные впечатления от этих разли­чий, дав последним количественную характеристику, позво­лили бы сравнивать между собой территории, географиче­ски несходные, и, быть может, обнаружить некоторую связь между уровнем разноязычия (linguistic diversity), с одной стороны, и политическими, экономическими, географиче­скими, историческими и прочими внеязыковымифакторами— с другой.

2. Первый, простейший способ оценки — мы будем называть его методом А — это одноязычный не­взвешенный метод (monolingual nonweighted method) (смысл этого наименования вскоре станет ясным читателю). Вероятность того, что два произвольно взятых жителя данной территории говорят на общем языке, можно считать мерой разноязычия этой территории. Если все жители данной местности говорят на одном языке, то вероят­ность общего языка у двух произвольно взятых жителей, очевидно, равна 1, то есть достоверности. Наоборот, если каждый житель говорит на своем языке, то вероятность эта

Joseph Н. Greenberg, The Measurement of Linguistic Diversity, «Language», 32, 1956, 1, стр. 109—115.

будет равна нулю. Поскольку мы хотим измерять не сте­пень сходства, а уровень различий, то мы будем вычитать значения вероятности из 1, так что наш показатель будет изменяться в пределах от 0, что соответствует минималь­ному уровню разноязычия, до 1, то есть до самого высокого уровня.

Общая вероятность случайного отбора двух людей, говорящих на одном и том же языке, представляет собой сумму вероятностей такого отбора для каждого из распро­страненных в данной местности языков М, N, О и т. д. В свою очередь эти вероятности выражаются как ш2, п2, о2, . . ., где m — отношение числа носителей языка М ко всему населению, п — то же самое для языка N и т. д. Вычитая эти вероятности из 1, как мы только что услови­лись, получаем формулу :1 минус сумма квадратов ш, п, о и т. д., или

(I) А = 1-2,(.*),

где А — показатель разноязычия, а і последовательно при­нимает значения ш, п, о и т. д. Поясним это на условном примере. Если V8 населения некоторой местности говорит на языке М, 3/8 — на языке N и 1/2 — на языке О, то

А = 1 - [(У8)2 + (%)2 + (72)21 = 1 - 26/64 =

= 38/64, т. е. 0,593...

3. Есть два соображения, побуждающие строить другую модель, более сложную, но отражающую степень близости между языками. Дело в том, что, во-первых, при пропор­циональном распределении языков в каких-либо двух мест­ностях мы хотели бы считать более разноязычной ту из них, в которой говорят на языках неродственных или отда­ленно родственных, по сравнению с областью, где распро­странены близкородственные языки, входящие в одну язы­ковую группу.

Во-вторых, поскольку нет четкого опреде­ления, отличающего язык от диалекта, данные по разным территориям могут оказаться, строго говоря, несопостави­мыми, если придерживаться обычного условного разграни­чения. Ввиду этого можно предложить следующее видоиз­менение вышеописанной процедуры, которое мы назовем одноязычным взвешенным методом (mo­nolingual weighted method), или методом В. Для пары языков М и N вероятность случайного отбора последова­тельно сначала носителя М, а затем носителя N, равна произведению mn, где m (соответственно п) — это доля, которую составляют носители языка М (соответственно, языка N). Помножим это произведение на весовой коэффи­циент, пробегающий значения от 0 до 1; коэффициент этот, называемый коэффициентом сходства (resemblance) г, опре­деляется так: берем произвольный, но фиксированный набор слов, например новейшую редакцию глоттохроноло­гического списка, и подсчитываем для каждой пары язы­ков, какую долю составляют совпадающие слова. Посколь­ку измеряем мы реальное сходство, а не историческое род­ство, предлагается заимствования учитывать наравне со словами, восходящими к единому корню. Вычитая сумму взвешенных таким образом произведений из единицы, полу­чаем значение взвешенного одноязычного показателя В:

(2) В = 1 — Srnn (mn) (rMN ),

где rMN — коэффициент сходства между языками М и N, отвечающий приведенному определению. В сущности, ме­тод А можно считать частным случаем метода В, при кото­ром тип помножаются на 1, если они равны, и на 0, если они неравны. В частности, для первого примера

А = 1 - 1 х [(V8)2 + (3/8)2 + (V2)21 +

+ 0 х [(V8 х 3/8) + (V8 х V2) + (3/8 х V8) +

+ (3/8 х V2) + (V2 х V8) + (V2 x 3/8)].

Процедуру расчета показателя В можно проиллюстри­ровать на том же примере, слегка видоизменив его. При­нимая прежнее распределение языков М, N и О, допустим теперь, что коэффициент сходства между языками М и N равен 0,85, между М и О — 0,30, а между N и О — 0,25. Тогда

В = 1 — [(V64 X 1) + (3/64 X 0,85) +

+ (V16 X 0,30) + (3/64 X 0,85) + (9/64 X 1) +

+ (Vu X 0,25) + (Vu X 0,30) + (Vu X 0,25) +

+ (i/4 x 1)] = 0,381.

Очевидно, что В всегда меньше или равно А (последнее будет иметь место, только когда коэффициенты сходства для всех пар языков равны нулю). Безразлично, назовем ли мы языки, имеющие коэффициент сходства равный единице, разными языками или же будем считать, что это один й тот же язык. Мы, таким образом, попутно получили рабо­чее определение языка как совокупности говоров со 100-про­центным сходством «базовых» словарей — определение, ко­торое вне данного контекста необязательно окажется удач­ным. Пользуясь методом А, можно избавиться от извест­ной расплывчатости понятия «язык», приняв в качестве критерия языкового тождества коэффициент сходства, рав­ный 1,00 или чуть меньше, скажем как минимум 0,95.

4. В принципе мы предполагаем с учетом всевозможных поправок, что более разноязычными окажутся территории с низким уровнем коммуникации и что повышение этого уровня, сопряженное с ростом хозяйства и развитием госу­дарственности, как правило, должно вести к распростра­нению некоторого местного или заимствованного языка- посредника (lingua franca), к росту двуязычия и в конечном счете к исчезновению всех языков, кроме одного господст­вующего. Естественно поэтому ожидать, что между показа­телями разноязычия и показателями уровня культуры и экономики будут наблюдаться корреляции, выявить которые возможно только при учете фактора многоязычия.

Мы назвали показатели А и В одноязычными в том смыс­ле, что при их вычислении каждый житель территории учитывался как носитель только одного языка — своего родного. В настоящем разделе мы опишем ряд показателей, учитывающих данные о многоязычии. Сразу же напраши­вается простейший способ, который состоит в том, чтобы посчитать человека, говорящего на двух языках, за двоих, говорящего на трех языках — за троих и т. д. Назовем этот способ методом дробления индивида (split- personal і ty method) и обозначим его невзвешенный и взве­шенный варианты соответственно буквами С и D. Логиче­ски более приемлем, может быть, другой способ — метод случайного говорящего (random speaker meth­od), в свою очередь со взвешенным и невзвешенным ва­риантами. Этот метод основан на следующей вероятностной схеме. Допустим, что взят первый попавшийся житель дан­ной местности и что он полиглот, который с равной вероят­ностью заговорит на любом из известных ему языков; выбе­рем произвольно другого жителя, и вероятность того, что оба заговорят на одном языке, будем считать значением показателя Е, а вероятное значение коэффициента сход­ства между языками, на которых они заговорят,— значе­нием показателя F. Для населения сплошь одноязычного показатель Е будет иметь то же значение, что А, а показа­тель F — то же значение, что В. Процедура расчетов тоже будет, в общем, такая же, как при вычислении А и, соот­ветственно, В, но с той разницей, что население теперь раз­бивается на доли говорящих на каждом из языков и на не­скольких языках во всех возможных сочетаниях. Так, население местности, где употребляются языки М, N и О, будет разбито, скажем, на следующие доли: m = V8 — гово­рящие только на языке М; п = 3/8 — говорящие только на языке N; о = 1/16 — говорящие только на О; mn = V4 — двуязычные, говорящие на языках М и N; то = 0 —дву­язычные, говорящие на М и О; по = 3/16 —двуязычные, говорящие на N и О; и, наконец, тпо = 1/16 —трехъязыч­ные, говорящие на М, N и О. В сумме эти величины, есте­ственно, дают 1, то есть все население. Попарные произве­дения всех долей вычисляются, как было описано. В дан­ном случае этих пар 49, считая и те, которые имеют нуле­вое значение. Так, скажем, mn X mno = V4 X Vie = = Х/б4 »— вероятность того, что при случайном отборе пер­вый человек будет говорить на языках М и N, а второй окажется трехъязычным. Далее каждое произведение нуж­но поделить на число частей, полученное от перемножения. Так, произведение mn X mno в предыдущем примере нуж­но разделить на 6, что соответствует числу комбинаций языков ММ, MN, МО, NM, NN и N0. При вычислении пока­зателя Е эти значения умножаются либо на 1 для тождест­венных пар (ММ, NN), либо на 0 —для разнородных пар (MN, МО, NM и N0). В нашем примере, где произведение mn X mno = V4 X ViG = V64 делится на 6 частей, каждая из которых будет равна 1/384, две из них надо помножить на 1, а четыре — на 0, так что в результате получится 1/б4 X V3 = Vi92. При вычислении показателя F каждую из шести частей нужно помножить на коэффициент сход­ства соответствующей пары языков. Как и в предыдущих случаях, полученные значения суммируются и вычитаются из единицы.

Следующий возможный метод оценки — метод слу­чайных собеседников (random speaker-hearer method), или метод G. Этот показатель измеряется вероят­ностью того, что если произвольно взятый многоязычный житель некоторой местности заговорит на любом из извест­ных ему языков, то другой произвольно взятый житель этой местности сможет его понять, иными словами, будет знать

тот язык, на котором заговорит первый. Сглаживая эффект разноязычия, этот показатель более рельефно отражает распространение lingua franca. Практически применим только невзвешенный вариант этого метода. Процедура рас­чета та же, что и при методе Е; единственная разница состо­ит в том, что после того как произведения долей, характе­ризующих многоязычные группы, будут разделены на рав­ные части, каждая часть умножается на 1 не только для пар тождественных языков, но и для пар, второй член которых хотя бы в одной паре выступает в качестве первого члена. Так, возвращаясь к примеру из пункта 4, на единицу те­перь следует помножать доли, соответствующие не только парам ММ и NN, но и парам MN и NM, а на 0 —только доли, соответствующие парам N0 и МО. В результате вместо значения 1/192, полученного по методу Е, получаем V64 X 2/3 = 1/.

Наконец, последним предлагается показатель уровня коммуникации (index of communica­tion), Н, который определяется как вероятность того, что два произвольно взятых жителя некоторой местности гово­рят хотя бы на одном общем языке. Этот показатель отра­жает реальную возможность языкового общения между двумя случайными собеседниками, в силу чего он чувстви­тельнее других показателей реагирует на такие явления, как распространение вспомогательных языков. Чтобы опре­делить его, нужно сначала разделить все население на доли, отражающие число говорящих на каждом из языков и на каждой комбинации языков, а затем вычислить все попарные произведения этих долей, как при методе Е. За­тем, если среди языков, соответствующих сомножителям произведения, имеется хотя бы один общий, то такое про­изведение помножается на 1. Например, если V2o населения говорит на трех языках MNO и У20 — на двух языках ОР, то произведение этих долей, равное 7400, следует помножить на 1. Потом все произведения складываются. Вычитать их из 1 в данном случае, по-видимому, не имеет смысла, так как тогда мы получили бы не показатель коммуникации, а показатель разобщенности.

Уровень коммуникации и языковая однородность (вели­чина, противоположная разноязычию и определяемая вычи­танием показателей разноязычия из 1) — понятия не равно­значные. Действительно, при высоком уровне разноязычия показатель уровня коммуникации может быть равен 1, что

имеет место, когда все члены разноязычного населения владеют некоторым общим языком.

Отметим также, что описанные выше показатели не учи­тывают, что полиглот владеет известными ему языками неодинаково. Пока что нет удовлетворительного способа оценки этих различий, и даже если бы удалось его разрабо­тать, то едва ли возможно было бы его применить настолько широко, чтобы получить данные, характеризующие с этой точки зрения население целой области. Правда, можно было бы выделить основной, обычно родной язык, отличив его от прочих (такие сведения часто даже включают в пере­писи), но мы не видим, как дать этим различиям математи­ческое выражение, которое не было бы произвольным.

Условный пример табл. 1 показывает, каким образом

Таблица 1

с D Е F G н
I 0,80 0,40 0,80 0,40 0,80 0,20
II 0,83 0,37 0,75 0,365 0,66 0,48
III 0,64 0,31 0,60 0,30 0,40 1,00
IV 0,70 0,50 0,70 0,60 0,40 1,00

происходит рост уровня коммуникации. В строке I показа­но население, которое распадается на пять одноязычных групп, равных по численности и говорящих, соответствен­но, на языках М, N, О, Р и Q; коэффициент сходства для любой пары языков равен 0,50. На стадии, отраженной в строке II, один из языков, М, начал распространяться и усвоен половиной носителей каждого из остальных четы­рех языков. В результате V5 населения говорит только на М, по Vio приходится на двуязычные группы MN, МО, МР и MQ, а еще по 1/і0 — это одноязычные, не говорящие на М. На следующей стадии (III), язык М известен уже всему населению, которое, если не считать исконных носи­телей М, теперь сплошь состоит из двуязычных. IV строке соответствует следующая картина: имеется универсальный язык-посредник R, не родственный ни одному из местных языков; население, таким образом, распадается на пять равных по численности двуязычных групп: MR, NR, OR, PR и QR, причем коэффициент сходства между языком R и любым местным языком = 0,00, а между местными язы­ками, как и ранее, 0,50. Как указывалось, С обозначает невзвешенный метод дробления индивида, D — взвешенный метод дробления индивида, Е — невзвешенный метод слу­чайного говорящего, F — взвешенный метод случайного говорящего, G — метод случайных собеседников и Н — показатель уровня коммуникации.

5. Поскольку исходные данные о группах, говорящих на том или ином языке или на той или иной комбинации языков, выражаются долями от общей численности населе­ния, вышеизложенные методы применимы к различным местностям независимо от территории и численности насе­ления (что является, несомненно, достоинством этих мето­дов). Какие области избрать объектом для сравнения — этот вопрос исследователь решает по своему усмотрению, исходя из специфики интересующих его проблем. В обычном случае сравниваемые области должны быть хотя бы прибли­зительно равны по территории и численности населения. В самом деле, представляется сомнительным, чтобы можно было извлечь какую-либо пользу, скажем, из сравнения уровня разноязычия на островах Зеленого Мыса с соот­ветствующим показателем, вычисленным для Азиатского континента. В то же время подобрать для сравнения мест­ности, абсолютно одинаковые по территории или по числен­ности населения, бывает практически невозможно, так как данные переписей всегда относятся к установленным поли­тико-административным единицам.

Возникает вопрос, нельзя ли учесть эти расхождения, внеся некоторый поправочный коэффициент. В принципе при увеличении территории разноязычие должно возрас­тать. Можно показать, что если вычислить показатели разноязычия отдельно для местностей X и Y, а затем для объединенной территории X + Y, то общий показатель будет больше обоих или хотя бы одного из них. Равен он будет частным показателям лишь в случае их равенства между собой, а также если в местностях X и Y в одина­ковых пропорциях распределены одни и те же языки; ни при каких условиях общий показатель не будет меньше каждого частного.

Сказанное можно проиллюстрировать данными табл. 2. Из 32 [126] штатов и территорий Мексики у 20 показатель А

Агуас Кальентес ........................................................................ 0,0016 0,9997

Вера Крус.................................................................................... 0,3465 0,8175

Герреро ...................................................................................... 0,3655 0,7371

Гуанахуато ................................................................................. 0,0152 0,9992

Дуранго...................................................................................... 0,0404 0,9862

Идальго ...................................................................................... 0,5060 0,6665

Кампече .................................................................................. 0,4997 0,7042

Керетаро .................................................................................... 0,1665 0,9469

Кинтана-Роо ............................................................................... 0,5508 0,7448

Коауила ...................................................................................... 0,0324 0,9998

Колима ....................................................................................... 0,0140 1,0000

Мехико, штат............................................................................. 0,3763 0,8635

Мичоакан ................................................................................... 0,1189 0,9624

Морелос ..................................................................................... 0,2476 0,9949

Наярит ........................................................................................ 0,0720 0,9588

Нуэво-Леон................................................................................. 0,0288 0,9978

Оахака ........................................................................................ 0,8363 0,4767

Пуэбла ....................................................................................... 0,5922 0,7043

Сан-Луис-Потоси ....................................................................... 0,3357 0,8610

Сакатекас .................................................................................... 0,0002 0,9998

Северная Нижняя Калифорния................................................... 0,3893 0,9434

Синалоа ...................................................................................... 0,0618 0,9950

Сонора ....................................................................................... 0,2226 0,9577

Таваско ....................................................................................... 0,1871 0,9588

Тамаулипас ................................................................................ 0,0570 0,9988

Тласкала ..................................................................................... 0,3104 0,8982

Федеральный округ.................................................................... 0,1295 0,9994

Халиско ...................................................................................... 0,0141 1,0000

Чиуауа ........................................................................................ 0,1955 0,9112

Южная Нижняя Калифорния............................. '........................ 0,0315 0,9999

Юкатан..................................................................................... 0,4056 0,9998

Мексика .................................................................................... 0,3122 0,8386

Провинция Плато (Сев. Нигерия).............................................. 0,9539

(одноязычный невзвешенный метод) ниже, чем для страны в целом, и только у 12 — выше. У 23 отдельных штатов и территорий показатель уровня коммуникации Н выше, чем для страны в целом, и только у девяти он ниже. Пример Кавказа в этом смысле еще разительнее: шесть из семи кав­казских районов имеют показатель разноязычия А ниже, чем Кавказ в целом, и только у Дагестана, района исклю­чительно разноязычного, этот показатель несколько выше.

При сравнении двух районов, X и Y, естественно было бы ожидать, что если Y больше X, то уровень разноязычия в районе Y будет равняться уровню разноязычия в терри­ториальном комплексе, состоящем из X и дополнительного участка, равного Y — X, принимая, что на этом дополни­тельном участке уровень разноязычия тот же, что в райо­не X. Однако, как мы видели, разноязычие территориаль­ного комплекса нельзя определить исходя из показателей, характеризующих отдельные районы. Даже в случае, когда эти показатели равны, уровень разноязычия на объединен­ной территории будет зависеть от того, какие из языков того или иного района одновременно употребляются и в дру­гих районах, а всякое заведомое предположение на этот счет представляется произвольным. Проблема, таким обра­зом, остается пока не решенной.

6. Выше мы мимоходом указали на различие между уровнем возможностей общения, или уровнем коммуника­ции, измеряемым показателем Н, и степенью языковой однородности, меру которой можно получить, вычитая любой показатель разноязычия из единицы. Полезно опре­делить также, в чем заключается разница между взвешен­ными и невзвешенными показателями разноязычия. Для этого представим себе, с одной стороны, глухую сельскую местность с примитивным хозяйством, а с другой — про­мышленный район, население которого разноплеменно и состоит из переселенцев, недавно прибывших из районов, удаленных друг от друга. Невзвешенные показатели разно­язычия у этих двух местностей могут оказаться равными; однако взвешенные значения, отражающие степень сход­ства между языками, вероятно, покажут более высокий уровень разноязычия для промышленного района. Из этого примера видно также, что хотя, вообще говоря, в районах с низким уровнем коммуникации и хозяйственного разви­тия скорее можно ожидать высокого уровня разноязычия, связь эта далеко не проста. Так, повышение уровня комму­никации в местности, где до этого господствовала разобщен­ность, может на первых порах вызвать повышение всех показателей разноязычия.

Мы не будем здесь углубляться в рассмотрение связи между значениями отдельных показателей разноязычия и внеязыковыми факторами, так как изучение этой свя­зи — дело прежде всего социологии и этнографии. Итогом такого изучения могла бы явиться типологическая класси­фикация, которая установила бы, что районы, у которых совпадают значения всех показателей разноязычия, харак­теризуются одинаковыми экологическими, экономическими и политическими условиями.

7. В табл. 2 приведены значения ряда показателей, вычисленных специально, чтобы проиллюстрировать на примерах, какого рода данные можно получать с помо­щью описанных методов. Показатели А (невзвешенный одно­язычный метод) и Н (уровень коммуникации) рассчитаны для всех штатов и территорий Мексики и для страны в це­лом по данным переписи 1930 г.; выбор объясняется, в част­ности, наличием в этой переписи сведений о двуязычии. Взвешенные показатели не вычислялись, так как с этим сопряжены очень трудоемкие расчеты, да и все равно имеющаяся лингвистическая информация недостаточно пол­на. Затем следуют значения показателя А, вычисленные для семи районов Кавказа отдельно и для всей территории в целом по данным переписи 1926 г. Наконец, мы вычислили показатель А еще для одной территории — для провинции Плато в Северной Нигерии г. Это местность рекордно высо­кого разноязычия: показатель А для нее выше, чем для Дагестана и Оахаки, территорий, которые также весьма примечательны в этом отношении.

1 По данным справочника С. G. Ames, Gazetteer of the Plateau Province, Nigeria, Jos, 1932.

<< | >>
Источник: В. Ю. РОЗЕНЦВЕЙГ. НОВОЕ В ЛИНГВИСТИКЕ. ВЫПУСК VI. ЯЗЫКОВЫЕ КОНТАКТЫ. ИЗДАТЕЛЬСТВО «ПРОГРЕСС» Москва - 1972. 1972

Еще по теме Джозеф Гринберг ОПРЕДЕЛЕНИЕ МЕРЫ РАЗНОЯЗЫЧИЯ:

  1. Джозеф Гринберг ОПРЕДЕЛЕНИЕ МЕРЫ РАЗНОЯЗЫЧИЯ
  2. КОММЕНТАРИИ