ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн

Джозеф Гринберг ОПРЕДЕЛЕНИЕ МЕРЫ РАЗНОЯЗЫЧИЯ

1. При взгляде на карту распределения языков на достаточно обширном пространстве бросается в глаза несходство отдельных территорий: мы видим там и участки чрезвычайно пестрые, вроде Новой Гвинеи или Нубийских Холмов в Судане, и сравнительно однородные, такие, как Восточные Леса Северной Америки до завоевания или же современные Соединенные Штаты, и, наконец, все промежуточные градации.

В настоящей статье мы рассмотрим вопрос о выработке оценок, которые помогли бы в объективной форме выразить субъективные впечатления от этих различий, дав последним количественную характеристику, позволили бы сравнивать между собой территории, географически несходные, и, быть может, обнаружить некоторую связь между уровнем разноязычия (linguistic diversity), с одной стороны, и политическими, экономическими, географическими, историческими и прочими внеязыковымифакторами— с другой.

2. Первый, простейший способ оценки — мы будем называть его методом А — это одноязычный невзвешенный метод (monolingual nonweighted method) (смысл этого наименования вскоре станет ясным читателю). Вероятность того, что два произвольно взятых жителя данной территории говорят на общем языке, можно считать мерой разноязычия этой территории. Если все жители данной местности говорят на одном языке, то вероятность общего языка у двух произвольно взятых жителей, очевидно, равна 1, то есть достоверности. Наоборот, если каждый житель говорит на своем языке, то вероятность эта

Joseph Н. Greenberg, The Measurement of Linguistic Diversity, «Language», 32, 1956, 1, стр. 109—115.

будет равна нулю. Поскольку мы хотим измерять не степень сходства, а уровень различий, то мы будем вычитать значения вероятности из 1, так что наш показатель будет изменяться в пределах от 0, что соответствует минимальному уровню разноязычия, до 1, то есть до самого высокого уровня.

Общая вероятность случайного отбора двух людей, говорящих на одном и том же языке, представляет собой сумму вероятностей такого отбора для каждого из распространенных в данной местности языков М, N, О и т.

д. В свою очередь эти вероятности выражаются как ш², п², о², . . ., где m — отношение числа носителей языка М ко всему населению, п — то же самое для языка N и т. д. Вычитая эти вероятности из 1, как мы только что условились, получаем формулу :1 минус сумма квадратов ш, п, о и т. д., или

(I) А = 1-2,(.*),

где А — показатель разноязычия, а і последовательно принимает значения ш, п, о и т. д. Поясним это на условном примере. Если V₈ населения некоторой местности говорит на языке М, ³/₈ — на языке N и ¹/₂ — на языке О, то

А = 1 - [(У₈)² + (%)² + (7₂)²1 = 1 - ²⁶/64 =

= ³⁸/₆₄, т. е. 0,593...

3. Есть два соображения, побуждающие строить другую модель, более сложную, но отражающую степень близости между языками. Дело в том, что, во-первых, при пропорциональном распределении языков в каких-либо двух местностях мы хотели бы считать более разноязычной ту из них, в которой говорят на языках неродственных или отдаленно родственных, по сравнению с областью, где распространены близкородственные языки, входящие в одну языковую группу. Во-вторых, поскольку нет четкого определения, отличающего язык от диалекта, данные по разным территориям могут оказаться, строго говоря, несопоставимыми, если придерживаться обычного условного разграничения. Ввиду этого можно предложить следующее видоизменение вышеописанной процедуры, которое мы назовем одноязычным взвешенным методом (monolingual weighted method), или методом В. Для пары языков М и N вероятность случайного отбора последовательно сначала носителя М, а затем носителя N, равна произведению mn, где m (соответственно п) — это доля, которую составляют носители языка М (соответственно, языка N). Помножим это произведение на весовой коэффициент, пробегающий значения от 0 до 1; коэффициент этот, называемый коэффициентом сходства (resemblance) г, определяется так: берем произвольный, но фиксированный набор слов, например новейшую редакцию глоттохронологического списка, и подсчитываем для каждой пары языков, какую долю составляют совпадающие слова.

Поскольку измеряем мы реальное сходство, а не историческое родство, предлагается заимствования учитывать наравне со словами, восходящими к единому корню. Вычитая сумму взвешенных таким образом произведений из единицы, получаем значение взвешенного одноязычного показателя В:

(2) В = 1 — Srnn (mn) (r_MN ),

где r_MN — коэффициент сходства между языками М и N, отвечающий приведенному определению. В сущности, метод А можно считать частным случаем метода В, при котором тип помножаются на 1, если они равны, и на 0, если они неравны. В частности, для первого примера

А = 1 - 1 х [(V₈)² + (³/₈)² + (V₂)²1 +

+ 0 х [(V₈ х ³/₈) + (V₈ х V₂) + (³/₈ х V₈) +

+ (³/₈ х V₂) + (V₂ х V₈) + (V₂ x ³/₈)].

Процедуру расчета показателя В можно проиллюстрировать на том же примере, слегка видоизменив его. Принимая прежнее распределение языков М, N и О, допустим теперь, что коэффициент сходства между языками М и N равен 0,85, между М и О — 0,30, а между N и О — 0,25. Тогда

В = 1 — [(V₆₄ X 1) + (³/₆₄ X 0,85) +

+ (V₁₆ X 0,30) + (³/₆₄ X 0,85) + (⁹/₆₄ X 1) +

+ (V_u X 0,25) + (Vu X 0,30) + (Vu X 0,25) +

+ (i/₄ x 1)] = 0,381.

Очевидно, что В всегда меньше или равно А (последнее будет иметь место, только когда коэффициенты сходства для всех пар языков равны нулю). Безразлично, назовем ли мы языки, имеющие коэффициент сходства равный единице, разными языками или же будем считать, что это один й тот же язык. Мы, таким образом, попутно получили рабочее определение языка как совокупности говоров со 100-процентным сходством «базовых» словарей — определение, которое вне данного контекста необязательно окажется удачным.

Пользуясь методом А, можно избавиться от известной расплывчатости понятия «язык», приняв в качестве критерия языкового тождества коэффициент сходства, равный 1,00 или чуть меньше, скажем как минимум 0,95.

4. В принципе мы предполагаем с учетом всевозможных поправок, что более разноязычными окажутся территории с низким уровнем коммуникации и что повышение этого уровня, сопряженное с ростом хозяйства и развитием государственности, как правило, должно вести к распространению некоторого местного или заимствованного языка- посредника (lingua franca), к росту двуязычия и в конечном счете к исчезновению всех языков, кроме одного господствующего. Естественно поэтому ожидать, что между показателями разноязычия и показателями уровня культуры и экономики будут наблюдаться корреляции, выявить которые возможно только при учете фактора многоязычия.

Мы назвали показатели А и В одноязычными в том смысле, что при их вычислении каждый житель территории учитывался как носитель только одного языка — своего родного. В настоящем разделе мы опишем ряд показателей, учитывающих данные о многоязычии. Сразу же напрашивается простейший способ, который состоит в том, чтобы посчитать человека, говорящего на двух языках, за двоих, говорящего на трех языках — за троих и т. д. Назовем этот способ методом дробления индивида (split- personal і ty method) и обозначим его невзвешенный и взвешенный варианты соответственно буквами С и D. Логически более приемлем, может быть, другой способ — метод случайного говорящего (random speaker method), в свою очередь со взвешенным и невзвешенным вариантами. Этот метод основан на следующей вероятностной схеме. Допустим, что взят первый попавшийся житель данной местности и что он полиглот, который с равной вероятностью заговорит на любом из известных ему языков; выберем произвольно другого жителя, и вероятность того, что оба заговорят на одном языке, будем считать значением показателя Е, а вероятное значение коэффициента сходства между языками, на которых они заговорят,— значением показателя F.

Для населения сплошь одноязычного показатель Е будет иметь то же значение, что А, а показатель F — то же значение, что В. Процедура расчетов тоже будет, в общем, такая же, как при вычислении А и, соответственно, В, но с той разницей, что население теперь разбивается на доли говорящих на каждом из языков и на нескольких языках во всех возможных сочетаниях. Так, население местности, где употребляются языки М, N и О, будет разбито, скажем, на следующие доли: m = V₈ — говорящие только на языке М; п = ³/₈ — говорящие только на языке N; о = ¹/₁₆ — говорящие только на О; mn = V₄ — двуязычные, говорящие на языках М и N; то = 0 —двуязычные, говорящие на М и О; по = ³/₁₆ —двуязычные, говорящие на N и О; и, наконец, тпо = ¹/₁₆ —трехъязычные, говорящие на М, N и О. В сумме эти величины, естественно, дают 1, то есть все население. Попарные произведения всех долей вычисляются, как было описано. В данном случае этих пар 49, считая и те, которые имеют нулевое значение. Так, скажем, mn X mno = V₄ X Vie = ⁼ ^Х/б4 »— вероятность того, что при случайном отборе первый человек будет говорить на языках М и N, а второй окажется трехъязычным. Далее каждое произведение нужно поделить на число частей, полученное от перемножения. Так, произведение mn X mno в предыдущем примере нужно разделить на 6, что соответствует числу комбинаций языков ММ, MN, МО, NM, NN и N0. При вычислении показателя Е эти значения умножаются либо на 1 для тождественных пар (ММ, NN), либо на 0 —для разнородных пар (MN, МО, NM и N0). В нашем примере, где произведение mn X mno = V₄ X Vi_G = V₆₄ делится на 6 частей, каждая из которых будет равна ¹/₃₈₄, две из них надо помножить на 1, а четыре — на 0, так что в результате получится ¹/_б4 X V₃ = Vi9₂. При вычислении показателя F каждую из шести частей нужно помножить на коэффициент сходства соответствующей пары языков.

Как и в предыдущих случаях, полученные значения суммируются и вычитаются из единицы.

Следующий возможный метод оценки — метод случайных собеседников (random speaker-hearer method), или метод G. Этот показатель измеряется вероятностью того, что если произвольно взятый многоязычный житель некоторой местности заговорит на любом из известных ему языков, то другой произвольно взятый житель этой местности сможет его понять, иными словами, будет знать

тот язык, на котором заговорит первый. Сглаживая эффект разноязычия, этот показатель более рельефно отражает распространение lingua franca. Практически применим только невзвешенный вариант этого метода. Процедура расчета та же, что и при методе Е; единственная разница состоит в том, что после того как произведения долей, характеризующих многоязычные группы, будут разделены на равные части, каждая часть умножается на 1 не только для пар тождественных языков, но и для пар, второй член которых хотя бы в одной паре выступает в качестве первого члена. Так, возвращаясь к примеру из пункта 4, на единицу теперь следует помножать доли, соответствующие не только парам ММ и NN, но и парам MN и NM, а на 0 —только доли, соответствующие парам N0 и МО. В результате вместо значения ¹/₁₉₂, полученного по методу Е, получаем V₆4 X ²/₃ = ¹/_9б.

Наконец, последним предлагается показатель уровня коммуникации (index of communication), Н, который определяется как вероятность того, что два произвольно взятых жителя некоторой местности говорят хотя бы на одном общем языке. Этот показатель отражает реальную возможность языкового общения между двумя случайными собеседниками, в силу чего он чувствительнее других показателей реагирует на такие явления, как распространение вспомогательных языков. Чтобы определить его, нужно сначала разделить все население на доли, отражающие число говорящих на каждом из языков и на каждой комбинации языков, а затем вычислить все попарные произведения этих долей, как при методе Е. Затем, если среди языков, соответствующих сомножителям произведения, имеется хотя бы один общий, то такое произведение помножается на 1. Например, если V₂o населения говорит на трех языках MNO и У₂₀ — на двух языках ОР, то произведение этих долей, равное 7400, следует помножить на 1. Потом все произведения складываются. Вычитать их из 1 в данном случае, по-видимому, не имеет смысла, так как тогда мы получили бы не показатель коммуникации, а показатель разобщенности.

Уровень коммуникации и языковая однородность (величина, противоположная разноязычию и определяемая вычитанием показателей разноязычия из 1) — понятия не равнозначные. Действительно, при высоком уровне разноязычия показатель уровня коммуникации может быть равен 1, что

имеет место, когда все члены разноязычного населения владеют некоторым общим языком.

Отметим также, что описанные выше показатели не учитывают, что полиглот владеет известными ему языками неодинаково. Пока что нет удовлетворительного способа оценки этих различий, и даже если бы удалось его разработать, то едва ли возможно было бы его применить настолько широко, чтобы получить данные, характеризующие с этой точки зрения население целой области. Правда, можно было бы выделить основной, обычно родной язык, отличив его от прочих (такие сведения часто даже включают в переписи), но мы не видим, как дать этим различиям математическое выражение, которое не было бы произвольным.

Условный пример табл. 1 показывает, каким образом

Таблица 1

	с	D	Е	F	G	н
I	0,80	0,40	0,80	0,40	0,80	0,20
II	0,83	0,37	0,75	0,365	0,66	0,48
III	0,64	0,31	0,60	0,30	0,40	1,00
IV	0,70	0,50	0,70	0,60	0,40	1,00

происходит рост уровня коммуникации. В строке I показано население, которое распадается на пять одноязычных групп, равных по численности и говорящих, соответственно, на языках М, N, О, Р и Q; коэффициент сходства для любой пары языков равен 0,50. На стадии, отраженной в строке II, один из языков, М, начал распространяться и усвоен половиной носителей каждого из остальных четырех языков. В результате V₅ населения говорит только на М, по Vio приходится на двуязычные группы MN, МО, МР и MQ, а еще по ¹/_і0 — это одноязычные, не говорящие на М. На следующей стадии (III), язык М известен уже всему населению, которое, если не считать исконных носителей М, теперь сплошь состоит из двуязычных. IV строке соответствует следующая картина: имеется универсальный язык-посредник R, не родственный ни одному из местных языков; население, таким образом, распадается на пять равных по численности двуязычных групп: MR, NR, OR, PR и QR, причем коэффициент сходства между языком R и любым местным языком = 0,00, а между местными языками, как и ранее, 0,50. Как указывалось, С обозначает невзвешенный метод дробления индивида, D — взвешенный метод дробления индивида, Е — невзвешенный метод случайного говорящего, F — взвешенный метод случайного говорящего, G — метод случайных собеседников и Н — показатель уровня коммуникации.

5. Поскольку исходные данные о группах, говорящих на том или ином языке или на той или иной комбинации языков, выражаются долями от общей численности населения, вышеизложенные методы применимы к различным местностям независимо от территории и численности населения (что является, несомненно, достоинством этих методов). Какие области избрать объектом для сравнения — этот вопрос исследователь решает по своему усмотрению, исходя из специфики интересующих его проблем. В обычном случае сравниваемые области должны быть хотя бы приблизительно равны по территории и численности населения. В самом деле, представляется сомнительным, чтобы можно было извлечь какую-либо пользу, скажем, из сравнения уровня разноязычия на островах Зеленого Мыса с соответствующим показателем, вычисленным для Азиатского континента. В то же время подобрать для сравнения местности, абсолютно одинаковые по территории или по численности населения, бывает практически невозможно, так как данные переписей всегда относятся к установленным политико-административным единицам.

Возникает вопрос, нельзя ли учесть эти расхождения, внеся некоторый поправочный коэффициент. В принципе при увеличении территории разноязычие должно возрастать. Можно показать, что если вычислить показатели разноязычия отдельно для местностей X и Y, а затем для объединенной территории X + Y, то общий показатель будет больше обоих или хотя бы одного из них. Равен он будет частным показателям лишь в случае их равенства между собой, а также если в местностях X и Y в одинаковых пропорциях распределены одни и те же языки; ни при каких условиях общий показатель не будет меньше каждого частного.

Сказанное можно проиллюстрировать данными табл. 2. Из 32 ^{^[126]} штатов и территорий Мексики у 20 показатель А

Агуас Кальентес ........................................................................ 0,0016 0,9997

Вера Крус.................................................................................... 0,3465 0,8175

Герреро ...................................................................................... 0,3655 0,7371

Гуанахуато ................................................................................. 0,0152 0,9992

Дуранго...................................................................................... 0,0404 0,9862

Идальго ...................................................................................... 0,5060 0,6665

Кампече .................................................................................. 0,4997 0,7042

Керетаро .................................................................................... 0,1665 0,9469

Кинтана-Роо ............................................................................... 0,5508 0,7448

Коауила ...................................................................................... 0,0324 0,9998

Колима ....................................................................................... 0,0140 1,0000

Мехико, штат............................................................................. 0,3763 0,8635

Мичоакан ................................................................................... 0,1189 0,9624

Морелос ..................................................................................... 0,2476 0,9949

Наярит ........................................................................................ 0,0720 0,9588

Нуэво-Леон................................................................................. 0,0288 0,9978

Оахака ........................................................................................ 0,8363 0,4767

Пуэбла ....................................................................................... 0,5922 0,7043

Сан-Луис-Потоси ....................................................................... 0,3357 0,8610

Сакатекас .................................................................................... 0,0002 0,9998

Северная Нижняя Калифорния................................................... 0,3893 0,9434

Синалоа ...................................................................................... 0,0618 0,9950

Сонора ....................................................................................... 0,2226 0,9577

Таваско ....................................................................................... 0,1871 0,9588

Тамаулипас ................................................................................ 0,0570 0,9988

Тласкала ..................................................................................... 0,3104 0,8982

Федеральный округ.................................................................... 0,1295 0,9994

Халиско ...................................................................................... 0,0141 1,0000

Чиуауа ........................................................................................ 0,1955 0,9112

Южная Нижняя Калифорния............................. '........................ 0,0315 0,9999

Юкатан..................................................................................... 0,4056 0,9998

Мексика .................................................................................... 0,3122 0,8386

Провинция Плато (Сев. Нигерия).............................................. 0,9539

(одноязычный невзвешенный метод) ниже, чем для страны в целом, и только у 12 — выше. У 23 отдельных штатов и территорий показатель уровня коммуникации Н выше, чем для страны в целом, и только у девяти он ниже. Пример Кавказа в этом смысле еще разительнее: шесть из семи кавказских районов имеют показатель разноязычия А ниже, чем Кавказ в целом, и только у Дагестана, района исключительно разноязычного, этот показатель несколько выше.

При сравнении двух районов, X и Y, естественно было бы ожидать, что если Y больше X, то уровень разноязычия в районе Y будет равняться уровню разноязычия в территориальном комплексе, состоящем из X и дополнительного участка, равного Y — X, принимая, что на этом дополнительном участке уровень разноязычия тот же, что в районе X. Однако, как мы видели, разноязычие территориального комплекса нельзя определить исходя из показателей, характеризующих отдельные районы. Даже в случае, когда эти показатели равны, уровень разноязычия на объединенной территории будет зависеть от того, какие из языков того или иного района одновременно употребляются и в других районах, а всякое заведомое предположение на этот счет представляется произвольным. Проблема, таким образом, остается пока не решенной.

6. Выше мы мимоходом указали на различие между уровнем возможностей общения, или уровнем коммуникации, измеряемым показателем Н, и степенью языковой однородности, меру которой можно получить, вычитая любой показатель разноязычия из единицы. Полезно определить также, в чем заключается разница между взвешенными и невзвешенными показателями разноязычия. Для этого представим себе, с одной стороны, глухую сельскую местность с примитивным хозяйством, а с другой — промышленный район, население которого разноплеменно и состоит из переселенцев, недавно прибывших из районов, удаленных друг от друга. Невзвешенные показатели разноязычия у этих двух местностей могут оказаться равными; однако взвешенные значения, отражающие степень сходства между языками, вероятно, покажут более высокий уровень разноязычия для промышленного района. Из этого примера видно также, что хотя, вообще говоря, в районах с низким уровнем коммуникации и хозяйственного развития скорее можно ожидать высокого уровня разноязычия, связь эта далеко не проста. Так, повышение уровня коммуникации в местности, где до этого господствовала разобщенность, может на первых порах вызвать повышение всех показателей разноязычия.

Мы не будем здесь углубляться в рассмотрение связи между значениями отдельных показателей разноязычия и внеязыковыми факторами, так как изучение этой связи — дело прежде всего социологии и этнографии. Итогом такого изучения могла бы явиться типологическая классификация, которая установила бы, что районы, у которых совпадают значения всех показателей разноязычия, характеризуются одинаковыми экологическими, экономическими и политическими условиями.

7. В табл. 2 приведены значения ряда показателей, вычисленных специально, чтобы проиллюстрировать на примерах, какого рода данные можно получать с помощью описанных методов. Показатели А (невзвешенный одноязычный метод) и Н (уровень коммуникации) рассчитаны для всех штатов и территорий Мексики и для страны в целом по данным переписи 1930 г.; выбор объясняется, в частности, наличием в этой переписи сведений о двуязычии. Взвешенные показатели не вычислялись, так как с этим сопряжены очень трудоемкие расчеты, да и все равно имеющаяся лингвистическая информация недостаточно полна. Затем следуют значения показателя А, вычисленные для семи районов Кавказа отдельно и для всей территории в целом по данным переписи 1926 г. Наконец, мы вычислили показатель А еще для одной территории — для провинции Плато в Северной Нигерии ^г. Это местность рекордно высокого разноязычия: показатель А для нее выше, чем для Дагестана и Оахаки, территорий, которые также весьма примечательны в этом отношении.

¹ По данным справочника С. G. Ames, Gazetteer of the Plateau Province, Nigeria, Jos, 1932.

<< | >>

↑

Источник: В. Ю. РОЗЕНЦВЕЙГ. НОВОЕ В ЛИНГВИСТИКЕ. ВЫПУСК VI. ЯЗЫКОВЫЕ КОНТАКТЫ. ИЗДАТЕЛЬСТВО «ПРОГРЕСС» Москва - 1972. 1972

Еще по теме Джозеф Гринберг ОПРЕДЕЛЕНИЕ МЕРЫ РАЗНОЯЗЫЧИЯ:

- Английский язык - Диалектология - Иностранные языки - История русского языка - Лексикология. Фразеология. Лексикография - Лингвокультура - Общая лингвистика - Общее языкознание - Русская филология - Русский язык - Синтаксис - Словообразование и морфология - Стилистика и культура речи - Украинский язык - Фонетика. Графика. Орфография -

- Архитектура и строительство - Безопасность жизнедеятельности - Библиотечное дело - Бизнес - Биология - Военные дисциплины - География - Геология - Демография - Диссертации России - Естествознание - Журналистика и СМИ - Информатика, вычислительная техника и управление - Искусствоведение - История - Культурология - Литература - Маркетинг - Математика - Медицина - Менеджмент - Педагогика - Политология - Право России - Право України - Промышленность - Психология - Реклама - Религиоведение - Социология - Страхование - Технические науки - Учебный процесс - Физика - Философия - Финансы - Химия - Художественные науки - Экология - Экономика - Энергетика - Юриспруденция - Языкознание -