МОДЕРНИЗАЦИЯ КИТАЙСКОГО ЯЗЫКА И ПИСЬМЕННОСТИ*
< ..>
С тех пор как в 1840 г. опиумная война открыла двери в само- изолировавшуюся Цинскую империю, год от года множатся контакты культур Китая и Запада, обмен между ними. Вначале в Китае знали только о смертоносности западного оружия, затем узнали, что для обновления оружия необходимо обновление производства, наконец, узнали и то, что коренная проблема заключается в обновлении системы образования *).
«Движение 4 Мая» 1919 г. стало кульминацией просветительского движения в Китае. Так же как и в просветительских движениях на Западе, обновлению системы образования в Китае предшествовало обновление языка и письменности. На Западе национальные языки пришли на смену латинскому языку. В Китае байхуа пришел на смену вэньяню.Проблемы языка и письменности в Китае гораздо сложнее, чем на Западе. Кроме проблемы сближения письменных стилей с разговорной речью, существует проблема формирования стандартного произношения общего языка и его распространения, проблема сложности и многочисленности иероглифов, с помощью которых невозможно точно передать звучание слов, и т.д. Так называемая «реформа письменности», или «реформа китайских иероглифов», фактически включает в себя два аспекта: «письменность» и «язык». Упрощение иероглифов, распространение путунхуа, разработка и внедрение проекта фонетического алфавита для китайского языка являются тремя задачами
Чжоу Югуан. Чжунго юйвэнь ды сяньдайхуа. - «Цзяоіой яньцзю», 1984, № 1, с. 33-40, Перевод дается с сокращениями.
* Данная статья представляет собой исправленный текст доклада, сделанного автором на международной научной конференции «Модернизация китайского языка», состоявшейся в Гонолулу (США) в сентябре 1983 г. Полное название конференции - «Конференция по модернизации китайского языка и письменности и языковому планированию в китаеязычных общинах».
реформы письменности[111].
Упрощение иероглифов и внедрение алфавита - это письменный аспект, распространение путунхуа — языковой аспект. С последних лет династии Цин и по настоящее время эти три задачи выполнены пока только частично. Обновление китайского языка и письменности все еще продолжается.Нуждаются ли в обновлении китайский язык и письменность — этот вопрос со времени движения за байхуа периода «4 Мая» является спорным. После того как движение за байхуа переросло в движение за упрощение иероглифов и переход на алфавитное письмо, споры становятся все более ожесточенными и уже распространились на китае- язычные общины во всем мире. Споры — положительное явление. Чем больше споров об истине, тем она яснее. Критика — это движущая сила улучшения работы. Реформа китайской письменности движется вперед под аккомпанемент споров.
«Модернизация языка и письменности», о которой я здесь говорю, является всего лишь моим личным пониманием принципов реформы письменности и машинной обработки китайских текстов, а также современного положения дел в этой области.
I. ОБЩИЙ ЯЗЫК И ПРОИЗНОСИТЕЛЬНЫЙ СТАНДАРТ
Обще китайский язык вначале назывался «гуаньхуа», затем был переименован в «гоюй», а в 1955 г. — в «путунхуа». На Тайване он по-прежнему носит название «гоюй». Термин «путунхуа» существовал уже в конце династии Цин[112] и первоначально обозначал общий язык, который могут понимать все; жесткий стандарт отсутствовал. В 1955 г. путунхуа было дано определение: «Общий язык китайской нации, основой которого являются северные диалекты, стандартным произношением — пекинское произношение, грамматической нормой — образцовые произведения на байхуа». Смысл перемены названия на путунхуа заключается в том, что этим выражается равноправие всех нацио- нольностей Китая, отрицается навязывание путунхуа национальным меньшинствам. Принятая в 1982 г. новая Конституция КНР устанавли-
вает, что «государство распространяет путунхуа, употребляемый по всей стране». Если понимать под «употреблением путунхуа по всей стране» и его употребление в районах проживания национальных меньшинств, то смысл термина «путунхуа» будет близок к тому, что понимается под термином «гоюй».
Конечно, выражение «употребляемый по всей стране» вовсе не означает насильственного насаждения путунхуа в районах проживания национальных меньшинств: ведь в настоящее время он мало употребляется и н районах распространения диалектов китайского языка. Общекитайский язык в Республике Сингапур и в других ареалах распространения китайского языка за пределами КНР называется «хуаюй». Я считаю, что «хуаюй» — удачное название, которое может использоваться в любой стране, любом регионе, в различной обстановке. Тот факт, что вплоть до настоящего времени отсутствует единое название общекитайского языка, показывает, что, хотя китайский — язык древний, общекитайский язык все еще очень молод.Установление произносительного стандарта — это показатель достижения общим языком «совершеннолетия». То, что «стандартным произношением путунхуа является пекинское произношение», есть результат исторического развития, в ходе которого на протяжении тысячи с лишним лет при династиях Ляо, Цзинь, Юань, Мин, Цин столицей Китая был Пекин. В 1913 г. на Конференции по унификации чтений иероглифов методом голосования, при котором каждая провинция имела один голос, большинством голосов в качестве стандарта было утверждено не пекинское, а искусственно созданное произношение. В 1924 г. от этого искусственного произношения отказались в пользу «стандарта, основьюающегося на пекинском произношении»[113]. Можно сказать, что 1924 г. является «годом совершеннолетия» общего языка. С 1913 по 1924 г., в течение 10 лет, сформировалось понимание «стандартного произношения, основанного на пекинском произношении». Определение путунхуа 1955 г. — это не более чем следование исторической реальности.
В пекинском диалекте существует немало слов, имеющих два и более чтений. Для этих «разночтений» нужно установить произносительный стандарт. Учрежденная в 1956 г. Орфоэпическая комиссия путунхуа в 1957, 1959 и 1962 гг. опубликовала три части «Проекта списка слов с рекомендованным чтением», в который было включено 170 названий, главным образом названий городов и уездов.
В 1963 г. вышеназванные материалы были изданы в виде брошюры с «Проектом сводного списка слов путунхуа с рекомендованным чтением, состоящим из трех частей» (издательство Комитета реформы письменности). В дальнейшем работа в этой области в течение длительного времени находилась в состоянии застоя. Орфоэпическая комиссия путунхуа была воссоздана и возобновила свою деятельность только в 1982 г.В 1956 г. были определены принципы выбора орфоэпической нормы для разночтений. Их главное содержание сводится к следующему:
1. Чтение предлагается для слова, а не для иероглифа. Например, слово «волна» имеет два чтения: boling и poling, которые необходимо подвергнуть рассмотрению. Иероглиф же (1) хотя и имеет два чтения, но в слове «эффективность» имеет чтение Ш, а в слове «руководить» — только shuai, и эти чтения не являются объектом рассмотрения.
2. Когда некоторые чтения ряда иероглифов в пекинском диалекте не столь широко распространены, то, даже при их несоответствии общим закономерностям развития пекинского произношения, их все же можно использовать; в то же время следует учитывать, насколько широко данное чтение распространено в северных диалектах. Например, в пекинском диалекте иероглиф (2) ‘опасность’ читается wei, (3) ‘срок, период’ — qi. Эти чтения не соответствуют общим закономерностям, однако* используются, так как широко распространены в пекинском диалекте, а также в большинстве северных диалектов4.
3. Чтения выбираются по принципу отнесенности медиалей к категории кай или хэ, причем предпочтение отдается категории кай; при этом в качестве стандарта берется разговорное произношение. Например, иероглиф (4) ‘мокнуть’ читается 1т, а не lun или lun.
4. Иероглифы, которые в древности читались входящим тоном и имели на конце слога глухие согласные, в пекинском диалекте могут читаться различными тонами, в том числе и ровным тоном. Для них, как правило, предлагается чтение ровным тоном, например знак (5) ‘дыхание’ — как xi, (6) ‘сбить’ — ji. В других случаях каждый иероглиф рассматривается отдельно и выбирается самое распространенное чтение.
5. Для каждого слога выбирается, как правило, одно чтение, однако небольшое число слов сохраняет два чтения. Например, знак (7) ‘кровь’ читается xie и хиё (см. объяснения к вышеуказанному «Проекту сводного списка»)5.
Основные принципы выбора чтений географических названий сводятся к следующему:
Существует также и другое мнение, согласно которому иероглифы (2) и (3) следует читать восходящим тоном.
Существует другая точка зрения, согласно которой следует всячески избегать того, чтобы у одного иероглифа было два чтения. Мнения, подобные тому, что у иероглифа (7) чтение хиё нужно заменить на xie, представляются неверными.
1. Если местное чтение географического названия отличается от его пекинского чтения, то в качестве стандарта берется пекинское. Например, иероглиф (8) в названии уезда Мэйсянь имеет местное чтение пи, а в Пекине читается mei; иероглиф (9) в слове Люэян имеет местное чтение luo, а пекинское — lue. Чтение этих иероглифов изменяется в соответствии с фонетическими закономерностями, в качестве стандарта берется пекинское.
2. Если некоторые иероглифы, обозначающие географические названия, имели в прошлом определенные особые чтения, совпадающие сейчас с местными, то, исходя из принципа «имя дается хозяином», чтения этих названий изменениям больше не подлежат. Например, имя собственное (10) читается Yufcyang, а не Liyang, (11) читается Xi£yu, а не Леуй[114].
3. Если ряд иероглифов, обозначающих географические названия, имел в прошлом особые чтения, с которыми современные чтения не совпадают, то в этом случае в соответствии с закономерностями соотношения пекинского и местного произношения эти иероглифы получают чтение на путунхуа. Например, установлено, что имя собственное (12) читается Heze (а не Geze).
В 1982 г. после возобновления работы Орфоэпической комиссии был дополнительно разработан документ «Сфера и принципы рассмотрения чтений иероглифов». Его основное содержание:
1. Сфера рассмотрения
а) Рассмотрению подлежат только чтения слов путунхуа, включая чтение распространенных в путунхуа вэньянизмов, чэнъюев, афоризмов; чтения диалектных слов (включая пекинский местный говор) и слов древнекитайского языка не рассматриваются;
б) рассматриваются только разночтения из разговорного языка, новые чтения и слова, появившиеся лишь в последние годы;
в) рассматриваются только чтения сложных иероглифов, обозначающих имена и фамилии людей и географические названия, которые появились в печати в последние годы.
2. Принципы рассмотрения
а) При рассмотрении чтений отдельных слов необходимо исходить из требований соответствия закономерностям эволюции фонем пекинского диалекта, а также удобства с точки зрения изучения путунхуа в диалектных районах; необходимо исходить также из реальной обстановки, учитывая произношение, привычное для большинства говорящих. Например, иероглиф (13) ‘передавать’ в слове (14) ‘радио’ (по словарю «Гуанъюнь» в транскрипции фаньце, уходящий тон) в старых словарях читался Ь6, а в настоящее время большинством читается как Ьо;
б) при выборе чтений имен и фамилий, географических названий отдается предпочтение современному чтению перед старым, более распространенному перед менее распространенным, более привычному для большинства перед менее привычным; к принципу «имя дается хозяином» необходимо подходить осторожно; следует учитывать, восходит ли данное чтение к диалектному и если да, то как оно соотносится с чтением на путунхуа. Диалектный вариант в этом случае не подходит. Например, имя собственное (15) из диалекта провинции Цзянси не следует транскрибировать Yanshan, так как в этом диалекте иероглиф (16) ‘графит’ из слова (17) ‘карандаш’ тоже читается уап;
в) если некоторый иероглиф имеет одно значение, но несколько чтений, то последние также объединяются в одно с помощью таких методов, как сокращение, пересмотр и дополнение. Например, иероглиф (18) ‘палец; показывать, иметь в виду’ читается zhi (в слове (19) ‘ноготь’), zhi (в слове (20) ‘палец’), zhi (в слове (21) ‘показывать’). Все эти чтения можно заменить одним — zhi (см. статью «Сфера и принципы рассмотрения чтений иероглифов» в журнале «Вэньцзы гайгэ», 1982, №3).
«Проект сводного списка слов путунхуа с рекомендованным чтением, состоящий из трех частей», будет рассмотрен еще раз, после чего он приобретет характер официального документа. Содержание его также будет расширено. Рассмотрение чтений производится, исходя из ситуации, существующей в континентальном Китае. Вопрос, применимы ли его результаты в других китаеязычных общинах, нуждается в изучении.
Выбор орфоэпической нормы для разночтений — это один из аспектов нормализации китайского языка. Еще один ее аспект — упорядочение лексики, главным образом научно-технической терминологии, а также имен и географических названий, являющихся фонетическими заимствованиями. Калькирование может быть осуществлено многими способами; для фонетических заимствований помехой служат иероглифы-омофоны и диалектные чтения. Сегодня, когда быстро развивается наука и техника, в широких масштабах осуществляется гуманитарный обмен, нормализация фонетических заимствований превратилась для китайского языка в важную проблему. Только после того, как новый термин просуществует много лет, намечается тенденция к его единообразному переводу. Например, термин «лазер» первоначально переводился методом фонетического заимствования и читался лайсай, а впоследствии стал переводиться калькой цзигуан, тогда как за пределами континентального Китая он переводится и по-другому, например лэйшэ. После прихода в США к власти Рейгана появились различные способы транскрибирования его фамилии, такие, как Лигэнь (Пекин), Лэйгэнь (Тайвань), Легэнь (Гонконг); при этом используются разные иероглифы, читающиеся также по-разному. В последние годы все научные и специализированные организации уделяют большое внимание унификации терминологии, проводят множество совещаний по вопросам выбора и утверждения терминов, обсуждают проблему сокращения числа терминов-омонимов, издают много различных терминологических словарей. Это сыграло известную роль в нормализации, однако впереди еще предстоит большая работа. Появления в различных китаеязычных общинах разных вариантов одного и того же термина избежать трудно. Если окажется возможным сократить расхождения и увеличить единообразие, то возрастет удобство использования китайского языка (хуаюй) на международном уровне.
Ключевым звеном в распространении путунхуа является подготовка преподавателей. В Пекине и во всех провинциях имеются «курсы изучения путунхуа», обязательные для преподавателей языка и письменности учебных заведений всех типов. Чтобы обеспечить более точную оценку знаний, в последнее время в экспериментальном порядке разработан документ «Критерии уровней владения путунхуа». Первый уровень означает умение свободно употреблять стандартный путунхуа, а также точное произношение звуков и тонов при чтении распространенных иероглифов; обороты речи и интонация должны соответствовать стандарту, лексика и грамматика — быть нормативными; не допускается употребление диалектизмов во время публичных выступлений, декламаций и в беседах. Второй уровень означает умение употреблять соответствующий стандарту путунхуа, в котором, однако, могут проскакивать диалектизмы в произношении; звуки и тоны при чтении распространенных иероглифов должны произноситься точно, неточности в их произношении должны ощущаться и корректироваться самим говорящим; обороты речи и интонация в целом должны быть правильными, лексика и грамматика — в целом соответствовать норме; диалектизмы во время публичных выступлений, декламаций и в беседах не должны влиять на взаимопонимание. Третий уровень означает умение говорить на нестандартном путунхуа; при этом звуки и тоны в основном должны быть правильными, лексика и грамматика — в основном соответствовать норме; произношение во время официальных выступлений и бесед имеет в этом случае заметную диалектную окраску, а взаимопонимание Достигает обычно 90%. Навыки владения путунхуа, не достигающие третьего уровня, относятся к подготовительному уровню, а превышающие требования первого уровня выделяются в особый уро-
вень. Применяя эти критерии, следует выдвигать дифференцированные требования с учетом различий в месте жительства, профессии, возрасте, национальности того или иного лица.
Мы с радостью услышали о больших успехах в распространении гоюя на Тайване, о том, что растет внимание к распространению языка хуаюй в Сингапуре, предпринимаются соответствующие усилия в Малайзии, с каждым годом растет число курсов по изучению этого языка для населения Гонконга. Распространение путунхуа на континенте попеременно переживает периоды бурного подъема и упадка, в разных районах происходит неравномерно. Недавно в Конституцию внесено положение о распространении путунхуа. Это является сигналом к тому, что надо собраться с силами и всемерно проводить такую работу. То, что в китаеязычных общинах по всему миру общему языку придается все большее значение, представляет собой явление обнадеживающее; это следствие развития транспорта и повышения культуры.
II. УПОРЯДОЧЕНИЕ ИЕРОГЛИФОВ И ПРОБЛЕМА ИЕРОГЛИФИЧЕСКОЙ ПИСЬМЕННОСТИ НА СОВРЕМЕННОМ ЭТАПЕ
В настоящее время упорядочение иероглифов включает: 1) определение числа иероглифов; 2) упрощение и стандартизацию начертаний иероглифов; 3) стандартизацию чтений иероглифов; 4) стандартизацию структуры словарей иероглифов.
1) Определение числа иероглифов
«Число иероглифов постоянно и повсеместно растет, при их рождении об этом не сообщается, а когда в определенный момент в них исчезает необходимость, то после смерти их не хоронят. В иероглифических словарях мертвые и живые знаки находятся рядом и различия между ними не фиксируются. Сколько же иероглифов нужно в конце концов использовать для записи современного китайского языка? Никто не может этого сказать. Данное явление не следует рассматривать как само собой разумеющееся»7.
Перепись населения необходима. Необходима и перепись иероглифов. При переписи населения переписываются только живые люди. При переписи иероглифов должны переписываться только иероглифы современного китайского языка. «Определить размеры иероглифи-
п
См. Чжоу Югуан. Очерк реформы китайской письменности, раздел «Исследование проблемы полного списка иероглифов современного китайского языка». Бэйцзин, 1961, с. 312.
ческого наследства, издать полный список иероглифов современного китайского языка — это станет большим событием в истории китайской письменности!»[115] В словарях иероглифов всех эпох число включенных в них знаков известно, однако оно не эквивалентно общему числу иероглифов, находящихся в употреблении. Сколько всего древних и современных иероглифов? Трудно ответить на этот вопрос. Если провести общий подсчет безотносительно к эпохе, то его ценность будет невелика. Срочной задачей является выяснение того, сколько всего и каких именно «иероглифов современного китайского языка» существует[116]. Это имеет как практическое, так и научное значение.
Хотя большинство иероглифов создано путем комбинаций элементов, после завершения такой комбинации они становятся целостными самостоятельными знаками. Иероглифы нельзя механически разлагать на части и соединять. Если два иероглифа (22) ‘дерево’ соединить вместе, то они не станут правильным иероглифом (23) ‘лес’, так как в последнем начертание двух знаков (22) ‘дерево’ неодинаково. В иероглифах (24) ‘просить’ и (25) ‘благодарить’ ключом является элемент
(26) ‘речь . Однако под воздействием элементов, находящихся справа от него, его начертание не может быть в различных случаях совершенно одинаковым. Десять тысяч иероглифов — это десять тысяч индивидуальных знаков. Такая ситуация в огромной степени отличается от существующей при алфавитной письменности, где «число слов не ограничено, а число знаков ограничено». Наличие неопределенно большого числа знаков является коренной причиной того, что иероглифы трудно учить и неудобно использовать. Поэтому выяснение общего числа иероглифов современного китайского языка является основным содержанием работы в области упорядочения иероглифов.
Некоторые говорят, что число иероглифов определить невозможно. Верна ли такая теория «невозможности»? Астрономы могут подсчитать, сколько звезд на небе. Географы могут определить размеры океана, Почему же нельзя определить число иероглифов? Конечно, при этом исследователя ожидает множество проблем. Прежде всего — как разграничить древнее и современное. В современном байхуа имеются цитаты, чэнъюи, слова из вэньяня; «древность» это или «современность»? Далее, надо ли при определении числа иероглифов ограничиться теми, которые употребляются в печатных изданиях, или же включить в подсчеты и те, которые в печатных изданиях не употребляются? При переписи населения обнаружилось множество удивительных иероглифов в именах собственных, при переписи географических названий — множество удивительных иероглифов, используемых для их обозначения. В свое время ни один из них не попал в словари и книги, даже их чтение является проблемой. Третья проблема: как доказать, что «список иероглифов», который в будущем будет составлен, станет «полным списком»? Будет ли он действительно исчерпывающим?
По статистике, 6600 иероглифов покрьюают 99,999% всех иероглифов, встречающихся в современных китайских текстах[117]. Четвертая проблема заключается в том, можно ли «ограничить» число иероглифов, до какого предела оно может расти и с какого момента нужно отбирать только новые слова, не создавая новых иероглифов?[118] Кроме того, имеются и другие проблемы. Эти проблемы нуждаются в самостоятельном исследовании и могут быть разрешены, хотя это и нелегко.
В 1981 г. в Пекине опубликован государственный стандарт 2312—80 «Основной набор иероглифов, закодированных для использования в ЭВМ», в который включено 6763 иероглифа: 3755 иероглифов первого и 3008 — второго уровней. В настоящее время готовятся два «вспомогательных набора» приблизительно по 8000 знаков в каждом; в них включены иероглифы в полном начертании и различные специальные иероглифы. Всего в этих трех наборах — более 23 000 иероглифов, что достаточно для обработки древних и современных текстов. Кроме того, имеется еще более 34 000 редких иероглифов, которые в дальнейшем можно дополнительно свести в несколько «резервных наборов», однако практическая польза от этого будет невелика. На Тайване также разработан сходный по характеру набор иероглифов. В будущем, если окажется возможным унифицировать критерии отнесения к той или иной категории, прежде всего критерии отнесения того или иного знака к иероглифам современного китайского языка, это окажет весьма благоприятное воздействие на машинную обработку китайских текстов.
Пока «Список иероглифов современного китайского языка» еще не появился, этот содержащий 6763 знака «Основной набор» можно использовать в качестве его заменителя. Однако они не равнозначны. «Основной набор» составлен на основе частотности употребления иероглифов, и при условии достаточной частотности употребления в него должны включаться иероглифы древнекитайского языка и специальные иероглифы. «Список иероглифов современного китайского языка» исходит из «типа иероглифа». Даже если частотность его употребления невелика, то для включения в список достаточно того, чтобы он использовался в современном китайском языке.
Опубликованный в 1981 г. в Японии" «Список употребляемых иероглифов» (включает 1954 знака) близок по характеру к 3755 иероглифам первого уровня «Основного набора». В японской письменности (а не как отдельное средство письма) имеется кана, в прессе и популярной литературе можно применять только иероглифы из «Списка употребляемых иероглифов», кроме того, они могут быть заменены каной. Поэтому Японии нужен только «Список употребляемых иероглифов», а не «Список иероглифов современного японского языка». В китайском языке дело обстоит иначе. По подсчетам, 3 800 иероглифов покрывают 99,9% всех употреблений иероглифов в современном китайском тексте. Если в оставшейся одной тысяче случаев можно было бы использовать буквы, то в прессе и популярной литературе употреблялось бы только 3755 иероглифов первого уровня «Основного набора». В настоящее время это не разрешается12, однако данная проблема заслуживает изучения.
2) Упрощение и стандартизация начертаний иероглифов
Упрощение начертаний является естественной тенденцией развития письма*). В истории всегда существовали упрощенные иероглифы. Если иероглиф употребляется часто, то в каждом таком случае возникает множество упрощенных вариантов его начертания. Когда империя Цинь объединила 6 царств, «в ней появилось много чиновников с обширным кругом обязанностей, и поэтому сформировалось писцовое письмо лишу как средство, облегчавшее их общение между собой». Смысл последующих изменений писцового письма заключается в его упрощении. Опубликованный в 1935 г. «Первый список упрощенных иероглифов» (324 знака), к сожалению, не был введен в действие. В 1956г. был издан «Проект упрощения китайской письменности» (515 упрощенных иероглифов и 54 упрощенных ключа), в 1964 г. по аналогии с ним — «Сводный список упрощенных иероглифов» (2238 знаков), которые уже используются в популярных печатных изданиях континентального Китая и Сингапура. Применение в экспериментальном порядке опубли-
1 2
Этот метод может быть использован в отдельных печатных изданиях в экспериментальном порядке. Надо полагать, что в настоящее время его повсеместное применение невозможно. Если однажды станет возможным ограничить число иероглифов, находящихся в употреблении, цифрой 3755, это будет большим событием в истории китайского письма.
кованного в 1977 г. «Второго проекта упрощения китайской письменности» прекращено из-за большого количества имеющихся в нем недостатков1 3.
Опыт подтверждает, что упрощение имеет свои положительные и отрицательные стороны. Детям, начинающим изучать китайскую письменность, и учащимся курсов ликвидации неграмотности упрощенные знаки нравятся; они считают, что такие знаки легко распознавать и писать. Учителя начальных школ поддерживают упрощение, так как оно облегчает преподавание. Иероглифы, упрощенные до 6—7 черт, по-прежнему понятны. При вводе иероглифов в ЭВМ по элементам также возникают опасения относительно их графической избыточности. Наибольшее одобрение встречают знаки фонетической категории. Например, слово
(27) ‘поддерживать’ распознавать и писать легче, чем (28) (оно же в полном начертании). Многие требуют перехода на систематическое употребление фонетических иероглифов. Это составляет положительную сторону упрощения.
Отрицательная сторона упрощения состоит в том, что оно привело к увеличению сходства в начертании различных иероглифов, например (29) ‘проводить в жизнь, пройти’ и (30) (те же в полном начертании), (31) ‘нет, строить’ и (32) (те же в полном начертании). Увеличилось число иероглифов-омонимов, например (33) ((34) qikn ‘тянуть’, (35) xian ‘мельчайший’), (36) ((37) gan ‘сухой’, (38) gin ‘работать’). Увеличилось число фонетических частей иероглифов, неточно передающих их звучание, например фонетическая часть (40) (ding ‘гвоздь’) иероглифа
(39) (deng ‘лампа’) — это хуже, чем фонетическая часть (42) (deng ‘подниматься’) этого же иероглифа в полном начертании (41), фонетическая часть (44) (ding ‘обязательно’) иероглифа (43) (dikn ‘мелководное озеро’) хуже, чем фонетическая часть (46) (dikn ‘дворец’) этого же иероглифа в полном начертании (45). Принятие скорописных начертаний в качестве знаков уставного письма увеличило смысловую нагрузку на черты иероглифов. Например, такие иероглифы, как (47) ‘книга’,
(48) ‘начальник, длинный’ неудобно писать и классифицировать по ключам. Замена одних иероглифов другими, имеющими такое же начертание, увеличила смысловую путаницу. При употреблении вэньянизмов проблема еще более обостряется, например в случае (49). В ходе реформы письменности первоначально реформировались только «современные», но не «древние» иероглифы. В библиотеках имеется большое количество старых книг, напечатанных иероглифами в полном начертании. Их продолжают использовать в Гонконге и на Тайване. Различа-
1 3
«Второй проект упрощения китайской письменности» был опубликован и в качестве эксперимента введен в действие в ненормальных условиях. Он не обсуждался, не говоря уже об утверждении, на общем собрании членов Комитета реформы китайской письменности.
ется начертание иероглифов в старых и новых книгах, в Китае и за его пределами.
При проведении упрощения исходным является принцип «привычности и удобства». Упрощение основывается на сформировавшихся в течение длительного времени привычках масс и поэтому легко проводится в жизнь. Применявшаяся прежде ходовая скоропись синшу фактически и легла в основу начертания упрощенных знаков. Однако принципу «привычности и удобства» недостает рациональности и системности, что порождает множество недостатков. Надо полагать, что осуществление рационального и системного упрощения окажется весьма трудным делом и может натолкнуться на противодействие силы привычки, «Второй проект упрощения китайской письменности» оказалось невозможным ввести в действие именно потому, что в нем имел место отход от принципа «привычности и удобства» и соответственно полностью изменился привычный вид иероглифов.
Различное начертание одних и тех же иероглифов отрицательно сказывается на культурном обмене. Проблема сокращения числа таких начертаний, увеличения их единообразия и в конечном счете стандартизация во всех китаеязычных общинах и даже в Китае и в Японии является сложным, но важным предметом исследования.
3) Стандартизация чггений иероглифов
Стандартизацией чтений иероглифов занялась состоявшаяся еще в первые годы после создания Китайской республики Конференция по унификации чтений иероглифов. «Рассмотрение чтений» путунхуа может способствовать стандартизации как произношения слов устного языка, так и литературных чтений иероглифов. Транскрипция различных чтений иероглифов в различных словарях не совпадает, и в настоящее время ведется изучение путей ее унификации. Кроме того, имеется еще проблема «разночтений». В одном из словарей собрано 7000 иероглифов, из которых 700 имеют по нескольку чтений. Чтения 40% этих иероглифов могут быть унифицированы. В случае, если это невозможно, оказывается достаточным точно определить, когда и как читается тот или иной иероглиф, что тоже будет стандартизацией.
4) Стандартизация структуры словарей иероглифов
В течение последних 50 лет были разработаны всевозможные способы отыскания иероглифов в словаре. В настоящее время четырьмя основными способами считаются: отыскание по ключу, отыскание по последней черте, отыскание по углам и фонетический способ. Однако всем им недостает унифицированности и жесткой стандартизации. Способом, который необходимо стандартизировать в первую очередь, является отыскание иероглифов по ключу. В разных словарях применяются различные способы отыскания иероглифов по ключу, существуют различия в числе ключей, их классификации, по-разному подсчитывается количество черт, различается порядок их начертания. Это положение необходимо как можно быстрее изменить.
Когда возникла необходимость вводить иероглифы в ЭВМ, крайне актуальный характер приобрело исследование способов кодирования иероглифов. Кодирование также осуществляется на принципах, лежащих в основе структуры словарей иероглифов. Об этом будет сказано ниже.
В течение последних 50 лет многие люди в Китае и за его пределами, применяя новые концепции и методы, исследовали упорядочение иероглифов и различные другие проблемы. В результате накопления материала и знаний в настоящее время происходит становление «современной теории иероглифического письма»[119]. Традиционная теория иероглифического письма (старое название — «малая наука», или «теория письма»), которая занимается исследованием происхождения начертаний и чтений иероглифов и изучает процесс их эволюции, является «исторической теорией иероглифического письма». Современная теория иероглифического письма выросла из школы исторической теории иероглифического письма. Объектом ее исследования являются особенности иероглифов современного китайского языка и связанные с этим проблемы, целью — обслуживание их употребления сейчас и в будущем. Проблемы, изучаемые современной теорией иероглифического письма, и методы исследования значительно отличаются от проблем и методов исторической теории иероглифического письма. Используя в качестве основы лингвистику, современная теория письма сочетает ее с такими смежными дисциплинами, как кибернетика, статистика, психология. Это — не пренебрежение или измена по отношению к исторической теории иероглифического письма, а модернизация китайской письменности.
IIL ПЕРЕХОД НА АЛФАВИТНОЕ ПИСЬМО И ПРОБЛЕМА ОРФОГРАФИИ
Опубликованный в 1918 г. алфавит «чжуинь цзыму» (впоследствии переименован в «гоинь фухао») имел в истории китайской письменности эпохальное значение. К сожалению, он стал лишь вспомогательным средством, а не вошел в письменность в качестве ее составной части, как это произошло с каной в Японии. При создании чжуинь цзыму был использован метод деления слога на три части, чем была разрушена традиция деления слога на две части — инициаль и финаль, что также имело прогрессивное значение.
Главный недостаток чжуинь цзыму — в том, что буквы этого алфавита созданы из элементов китайского иероглифического письма, а это затрудняет международный обмен. Поэтому в 1928 г. был разработан еще один алфавит — романизированный (GR)[120]. В романизированном алфавите латинские буквы были «китаизированы» и использовались в соответствии с особенностями китайского языка, а не в их привычных функциях в английской или другой западной письменности. Если бы с самого начала использовался «упрощенный» романизированный алфавит[121], то сейчас, возможно, он бы применялся повсеместно. В 1933 г. в Китае стала известна разработанная в Советском Союзе «новая латинизированная письменность для северных диалектов», представляющая собой еще одну попытку «китаизации» букв латинского алфавита *).
Некоторые говорят, что опубликованный в 1958 г. «Проект фонетического алфавита для китайского языка» является преемником латинизированной новой письменности. Это мнение неверно. «Проект фонетического алфавита» в своих основных характеристиках наполовину совпадает с романизированным, наполовину — с латинизированным алфавитом, а диакритические знаки для обозначения тонов восходят к чжуинь цзыму. «Проект» объединяет множество школ, а не является продуктом одной из них.
Под так называемым «переходом на фонетическое письмо» в широком смысле понимаются любые случаи употребления алфавита, в узком — достижение им статуса официальной письменности. Фонетический алфавит пиньинь цзыму достиг только статуса «транскрипции», но не официальной «алфавитной письменности». Для восполнения недостатков «алфавитной письменности» в Китае и за рубежом в период с 1958 по 1982 г. было разработано 1667 проектов «алфавитной письменности для китайского языка» (см, журнал «Вэньцзы гайгэ», 1982, №2). На деле, не пройдя этапа «транскрипции», абсолютно невозможно одним махом взобраться на вершину и достичь официального статуса «алфавитной письменности». Отбросить «Проект фонетического алфавита для китайского языка» и официально утвердить какой-либо другой проект в качестве «алфавитной письменности» невозможно. В течение прошедших 25 лет происходило широкое внедрение фонетического алфавита пиньинь цзыму. Произвольное исправление даже одной его буквы способно вызвать чрезвычайную путаницу. Фактически статус этого алфавита уже нельзя поколебать. Ежегодно его изучают десятки миллионов учащихся начальной школы и курсов ликвидации неграмотности. Он применяется для транскрибирования чтений иероглифов в Сингапуре и Малайзии. Конференция ООН по стандартизации транскрибирования географических названий и Международная организация стандартизации уже приняли решение об использовании алфавита пиньинь цзыму в качестве средства стандартной международной транскрипции китайских слов. Работа, которую предстоит проделать в дальнейшем, заключается в совершенствовании преподавания алфавита пиньинь цзыму и расширении сферы его применения, с тем чтобы алфавит использовался параллельно с иероглифами и осуществил свою функцию вспомогательной письменности[122], а не в том, чтобы стремиться к приданию ему официального статуса «алфавитной письменности», не имеющего практического значения.
Запись китайского текста алфавитом требует использования в качестве единицы языка слова. В словах раздельно, как иероглифы, писать каждый слог невозможно, так же как и писать все слоги в тексте слитно. Орфография отражает естественный ритм языка. Слитное и раздельное написание не представляет проблемы для общества, привыкшего к алфавитной письменности, но в обществе, привыкшем к иероглифической письменности, является незнакомой и даже непостижимой проблемой. В целях решения проблем орфографии и других проблем алфавитного письма в 1982 г. была создана Комиссия по орфографии фонетического алфавита для китайского языка. «Орфография» раньше называлась «правилами начертания иероглифов», с 60-х годов постепенно укоренился термин «орфография». Проблемы алфавитного письма на китайском языке не в морфеме, а в слове. Отказ от рассмотрения проблем орфографии алфавитного письма на основе морфемы как основной единицы языка, утверждение в качестве такой.
единицы слова представляется нововведением, имеющим принципиальное значение.
Задачами Орфографической комиссии являются разработка правил, редактирование словарей, внедрение норм алфавитного письма. Обратимся к вопросу разработки правил.
К правилам, которые необходимо разработать, относятся правила основные и специальные. В настоящее время всем заинтересованным инстанциям направлен для сбора мнений «Экспериментальный проект основных орфографических правил алфавитного письма».
Разработка основных правил ведется не на пустом месте. В 30-е годы имелись «правила орфографии слов», предназначенные для романизированного алфавита. Такие правила имелись и у латинизированной новой письменности в 30-е годы. За последние 25 лет были изданы различные печатные материалы на пиньинь цзыму, авторы которых постигали правила орфографии на практике. В настоящее время основные правила орфографии разрабатываются на базе прошлого опыта. Следует устранить расхождения и принять все то, что получило всеобщее одобрение, сохранить все достоинства и исправить недостатки, а опыт применения алфавита сформулировать в виде письменных правил, что будет удобно для его дальнейшего применения. Алфавитное письмо в принципе предназначено для записи звуков речи на слух, а орфография — это правила записи слов для их восприятия в письменной форме. Соединение системы, основывающейся на слуховом восприятии, с правилами, предназначенными для восприятия слов в письменной форме; запись понятного на слух звукового языка алфавитом в форме, понятной при зрительном восприятии, — как в том, так и в другом случае, имеется много сложных проблем. Назовем некоторые из них.
1. Что такое слово? Еще не дано определение слова, которое было бы ценно в теоретическом отношении и имело бы конкретное практическое значение. Выделяемое в грамматике «теоретическое слово» и пишущееся слитно на письме «формальное слово» трудно объединить в рамках одного понятия. Имеется специальный грамматический термин, но специального орфографического термина нет, отсутствие же строгости в терминологии ведет в ряде случаев к неточностям. В идеале орфография нуждается в единственном правиле: одно слово пишется слитно, два слова — раздельно. На деле все не так просто. Слова трудно разграничить между собой. Существует много случаев, когда несколько «теоретических слов» следует писать, как одно «формальное слово». Например, тушугуань ‘библиотека’ — это одно слово? Два слова? Три слова? Почему пишется слитно? Что такое гуань ‘официальное учреждение’? Слово? Морфема? Суффикс? Постпозитивный элемент? Аффикс? Показатель принадлежности к части речи? Логично ли такое утверждение: «Существительное (тушу ‘книга’) и стоящий за ним односложный
показатель принадлежности к части речи (гуань) пишутся слитно»?
2. Орфография связана со всеми аспектами языка: его грамматикой, семантикой, словообразованием, ритмической организацией. Однако эта связь противоречива. Нельзя учитывать только один аспект. При учете же нескольких аспектов какой из них считать главным? Например, в предложении Во чи фань, ни чи мянь ‘Я ем рис, а ты хлеб’ чи фань ‘ем рис’ пишется раздельно, а в словосочетании чифань вэньти ‘проблема еды’ чифань пишется слитно. Правильно ли это? Изменились значения слов, однако глагольно-объектные отношения изменений не претерпели. Почему же мы исходим не из глагольно-объектных отношений, а из значений? Опять же если под сюн-ди ‘братья’ понимать диди ‘младший брат’, то это слово пишется слитно, если же под ним понимается гэгэ хэ диди ‘старший и младший братья’, то оно пишется наполовину слитно (в середине ставится дефис). Можно ли, исходя из формальных критериев, и в том, и в другом случаях писать слитно?
3. Важным процессом, наблюдающимся в ритмической организации китайского языка, является его превращение в двусложный язык. Это оказывает сильное влияние на орфографию, однако вступает в противоречие с грамматикой и словообразованием. Например, название Шуньи сянь ‘уезд Шуньи’ может произноситься как Шуньи, а слово сянь ‘уезд’ при этом может быть опущено, тогда как название Тунсянь ‘уезд Тун- сянь’ не может быть сокращено до Тун (нельзя опустить сянь ‘уезд’). Как здесь писать сянь? Слитно? Раздельно? Или с двусложным именем собственным писать раздельно, а с односложным — слитно? В названиях островов Пэнхудао и Пэнхуледао писать имя собственное и имя нарицательное слитно, раздельно или односложное имя нарицательное писать с именем собственным слитно, а двусложное — раздельно? Почему?
4. На орфографию также влияет частотность употребления. Например, числительные и счетные слова пищутся раздельно (сань бэнь шу ‘три книги’), однако игэ (числительное и ‘один’ со счетным словом гэ) по привычке пишется слитно, так как оно часто употребляется (по характеру употребления сходно с неопределенным артиклем). Как определить частотность? Как часто должно употребляться слово, для того чтобы писать его слитно?
5. В китайском языке много «сцепляющихся слов»*), которые можно писать и раздельно, и слитно. Как поступать? В исходной форме писать их слитно, а в ее вариантах — раздельно? Например, как записывать алфавитом цзюйгун ‘кланяться’, цзюйлэ гун ‘поклонился’, цзюйлэ игэ гун ‘отбил один поклон’, цзюй мэй ю? - цзюйлэ ‘поклонился? — поклонился’, цзигэ гун? — игэ гун ‘сколько поклонов? — один поклон’?
6. Слова из вэньяня в большинстве своем односложные, их крайне трудно воспринимать на слух, и по характеру они отличаются от слов байхуа. Если в чэнъюях вэньяня каждое слово писать раздельно, то перестанет ощущаться единство текста и при их употреблении в байхуа будет нарушено его зрительное восприятие. В контексте такие слова будет сложно отделить от стоящих позади и впереди них, что затруднит чтение и понимание текста. В японском «Словаре китайского языка» Кураиси Такэсиро чэнъюи вэньяня пишутся слитно в один сплошной ряд, что также представляется слишком громоздким. В последние годы наметилась тенденция к компромиссному решению: писать слова или словосочетания из вэньяня через дефис, который их одновременно и соединяет, и разъединяет, например: Yugong-yf-shan ‘Юй Гун передвигает гору’, chengqian-bihbu ‘извлекать уроки из прошлого в назидание на будущее’. Однако и здесь возникает опасение, что придется писать слишком много дефисов. Как быть?
В отсутствие утвержденных правил написания слов в издающихся на алфавите пиньинь цзыму различных печатных изданиях написание 85% слов совпадает, в написании оставшихся 15% имеются большие расхождения. Нужно стремиться к устранению этих расхождений посредством привычного «общеупотребительного» написания, а этого нельзя достичь за короткое время.
«Проект фонетического алфавита для китайского языка» дает норму записи слогов. Орфография дает норму записи слов и словосочетаний. Соединение «Проекта» с орфографией и станет всесторонне разработанной системой алфавитного письма.
IV. СИСТЕМА СОЧЕТАНИЯ ДВУХ МЕТОДОВ МАШИННОЙ ОБРАБОТКИ КИТАЙСКИХ ТЕКСТОВ
Некоторые говорят, что, поскольку возможна машинная обработка непосредственно иероглифических текстов, алфавит уже больше не нужен. Дело обстоит как раз наоборот. Без алфавита ЭВМ не сможет стать орудием повышения культуры широких масс. ЭВМ, обрабатывающие иероглифические тексты, дорогостоящи, в них применяются сложные процедуры, одному человеку трудно работать на такой машине. Массовое внедрение ЭВМ возможно только в случае использования машин, обрабатывающих тексты, записанные алфавитом. Это также выгодно и с точки зрения установления связи с международной информационной системой. Это так же верно, как и то, что алфавитные пишущие машинки имеют массовое применение, а иероглифические могут эксплуатироваться не широким кругом людей, а лишь специально подготовленными машинистками в учреждениях. Для того чтобы машинная обработка китайских текстов шла в ногу со временем, необходимо использовать систему, сочетающую два метода: обрабатывать на ЭВМ и иероглифические тексты, и алфавитные. Первый из этих методов следует применять организациям, имеющим для этого необходимые человеческие и материальные ресурсы и где к тому же обязательно должны использоваться иероглифы. Второй — частными лицами, в семье, в школьных классах, в сравнительно небольших учреждениях.
Многими организациями Пекина в настоящее время проводятся эксперименты по созданию искусственного интеллекта. Например, в Академии китайской медицины ЭВМ используют для постановки диагнозов больным, ведения историй болезни, выписки рецептов; в Институте языкознания на ЭВМ проводятся эксперименты в рамках диалога «человек — машина»; в Институте психологии с помощью ЭВМ ставят эксперименты по «пониманию китайского языка». Во всех этих экспериментах используют алфавит, а не иероглифы. Почему? Причина очень проста: обработка иероглифических текстов требует дорогостоящего оборудования и сложных процедур. Поэтому система сочетания двух методов фактически уже существует, причем машины, обрабатывающие алфавитные тексты, заняли ведущее положение.
Конечно, это не означает, что не нужно развивать электронно-вычислительную технику, обрабатывающую иероглифические тексты. При обработке иероглифических текстов основная трудность заключается во вводе иероглифов в ЭВМ. К настоящему времени разработано более 400 способов ввода иероглифов в ЭВМ. Они подразделяются на три группы: 1) графические: иероглифы вводятся непосредственно в ЭВМ в порядке очередности по элементам. Этот метод уже утвердился, подходит для использования в таких крупных учреждениях, как типографии; 2) кодирование с помощью числового кода: более 400 имеющихся способов принадлежат главным образом именно к этой группе;
3) преобразование алфавита.
Способы кодирования иероглифов с помощью числового кода также подразделяются на несколько видов.
1. Кодирование элементов. Элементы, из которых состоят иероглифы, бывают большими и малыми. Большой элемент соответствует, как правило, ключу иероглифа, малые элементы образуются в результате дальнейшего разложения большого. Каждому элементу соответствует определенная клавиша на панели ЭВМ или же ему дается определенный числовой код.
2. Кодирование иероглифов по их особым признакам. В этом случае кодируются определенные особые признаки иероглифов, например третий или четвертый угол, первая или последняя черта.
3. Кодирование по чертам. Иероглифы состоят из черт, которые сводятся к нескольким основным видам. Каждому такому виду соответствует клавиша на панели ЭВМ или же ему дается определенный числовой код. Это старый способ, развивающийся на новой основе.
4. Числовое кодирование: каждому иероглифу на основании его места в словаре, частотности употребления или какой-либо другой характеристики дается числовой код. Наиболее старым и распространенным из таких кодов является четырехзначный телеграфный код.
5. Кодирование методом комбинации звучания и начертания: текст вводится частично с помощью алфавита или алфавитных сокращений, частично — иероглифами. Такого рода способов чрезвычайно много.
В настоящее время невозможно использовать только один способ ввода иероглифов в ЭВМ. Конечно, невозможно также использовать 400 или 40 способов. Чем больше способов — тем уже рынок сбыта соответствующей продукции, применение такой техники также создает массу неудобств. Как сократить число способов? Путь решения вопроса — проведение единой политики в области разработки способов введения иероглифов в ЭВМ путем классификации этих способов по группам, концентрации, подъема и стандартизации. Классификация — это объединение всех способов в указанные пять или некоторое другое количество групп. Концентрация — это сведение тех или иных особенностей ввода иероглифов в ЭВМ к какому-то общему знаменателю. Подъем — это проведение коллективных исследований и общее повышение уровня разработок. Стандартизация — это утверждение в качестве стандарта лучших из таких усовершенствованных способов. Каждые несколько лет проведенную работу следует анализировать и совершенствовать. Применение этого «четырехступенчатого метода проведения единой политики» может ускорить развитие способов ввода иероглифов в ЭВМ.
Коренным недостатком методов кодирования иероглифов с помощью числового кода являются большие затраты умственной энергии. Необходима специальная подготовка, изученное легко забывается; если владеешь одним из этих методов — не владеешь другим. Главным преимуществом ЭВМ является то, что они экономят умственную энергию. Экономия умственной энергии вступает в противоречие с ее большими затратами.
В новых разработках в области «преобразования алфавита» числовое кодирование совершенно не применяется. После ввода китайского алфавита или алфавитных сокращений в ЭВМ машина автоматически преобразует их в иероглифы. Это касается как отдельных знаков, так и написанных иероглифами слов, групп и сочетаний слов, предложений. У таких ЭВМ клавиш столько же, сколько у ЭВМ, обрабатывающих английский текст. Достаточно в начальной школе изучить китайский фонетический алфавит — и не потребуется никакой специальной подготовки.
В разработке такого метода уже достигнуты успехи, в недалеком будущем можно будет представить его для всеобщего ознакомления. Итогом этой разработки является «процессор для обработки китайских слов». Это не просто «электронная иероглифическая пишущая машинка». Она наделена большим количеством функций, более проста в эксплуатации, эффективность ее исключительно высока. Соединение китайского фонетического алфавита и ЭВМ полностью раскрывает особенности модернизации китайского языка и письменности. Это не один из 400 способов ввода иероглифов в ЭВМ, а совершенно иной метод, не имеющий ничего общего с графическим способом и кодированием с помощью числового кода. Он в корне отличается и от метода, сочетающего звучание и начертание, когда текст вводится в ЭВМ частично с помощью алфавита, а частично — с помощью числового кода.
Я полагаю, что по мере распространения обучения китайскому фонетическому алфавиту «процессор для обработки китайских слов», который автоматически преобразовьюает алфавит в иероглифы, станет самой перспективной моделью.
Уже запущены в серийное производство и поступили на рынок процессоры для обработки японских слов, по типу практически совпадающие с китайским процессором, о котором говорилось выше. В них используются кана или японский алфавит ромадзи, например Сапо- word—55, Тосиба JW—10, Фудзицу OASYS—100, в памяти которых хранится от 2965 до 6802 иероглифов и от 15 тысяч до 100 тысяч лексических единиц языка. Заслуживает внимания, что в большинстве процессоров для обработки японских слов кодирование иероглифов с помощью числового кода не производится. Почему? Причина здесь очень проста: люди при работе с ЭВМ не хотят идти на большие затраты умственной энергии, а требуют, чтобы работа с ЭВМ экономила их умственную энергию.
ЭВМ, в которых используется «метод преобразования алфавита», представляют собой машины, «идущие на двух ногах». Это и алфавитные, и иероглифические ЭВМ, причем и иероглифические ЭВМ должны опираться на китайский фонетический алфавит.
С появлением, с одной стороны, ЭВМ, использующих алфавит, а с другой — ЭВМ, использующих метод преобразования алфавитного текста в иероглифический, китайский фонетический алфавит продемонстрирует свою огромную роль в эру вычислительных машин.
Список иероглифов