ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

СОВРЕМЕННЫЕ ПРОМЫШЛЕННЫЕ СИСТЕМЫ

В данном разделе мы рассмотрим наиболее значительные из тех систем (Ч)МП, которые эксплуатируются и/или имеются в продаже в настоящее время. Некоторые из них созданы на базе описанных выше „неудавшихся" систем, другие явились в основной своей части результатом успешной (то есть не прерывавшейся) работы над соот­ветствующими проектами исследований и разработок в области МП.

Из числа полностью автоматизированных систем МП ниже будут описаны системы SYSTRAN, LOGOS, МЕТЕО, семейство систем корпорации „Weidner" и система SPANAN. Кроме того, будут рас­смотрены системы человеко-машинного перевода CULT и ALPS. Большинство этих систем принято в эксплуатацию несколькими поль­зователями (исключение составляют системы МЕТЕО, SPANAN и CULT, для каждой из которых известен только один пользователь). Начало промышленной эксплуатации самой ранней из этих систем относится к 1970 г.

„Стандартный тип эксплуатации" — если принять, что Он су­ществует,— предусматривает такие операции, как предредактирова- ние (в случаях, когда это необходимо), собственно перевод (в систе­мах ЧМП осуществляемый с активным участием человека) и более или менее серьезное постредактирование. С точки зрения пользо­вателя, степень приемлемости системы МП определяется количеством требуемого пред- и/или постредактирования (от этого в первую очередь зависит и стоимость). Как отмечается в Van Slype, 1982, «о приемлемости системы МП для переводчика-человека... можно, по-видимому, говорить в том случае, если объем правки (то есть постредактирования), требуемой для выдаваемых системой переводов, составляет менее 20% (менее одного исправления на каждые пять слов) и если переводчик может принимать участие в совершенствовании этой системы». Заметим, что скорость постре­дактирования растет по мере накопления опыта: в статье Р і g о 11, 1982, указывается, что «...чем больше переводчик работает с резуль­татами МП, тем лучше он овладевает этим своим новым инстру­ментом.

В некоторых случаях ему удается за несколько месяцев удвоить свою производительность, благодаря тому что он начинает распознавать типовые ошибки МП и находить более эффективные способы их исправления.»

Важно также иметь в виду, что, хотя ни одна из имеющихся систем не позволяет получать переводы, сравнимые по качеству с переводами (во всяком случае, с хорошими переводами), выпол­ненными человеком, пользователи этих систем считают достаточно целесообразным продолжать ими пользоваться. Более того, некото­рые пользователи приобретают их повторно. Короче говоря, нельзя утверждать, будто системы МП и ЧМП не работают, поскольку на самом деле их покупают и эксплуатируют, и их пользователи эконо­мят на этом свое время и/или средства. Каждый пользователь указывает, разумеется, на желательность повышения качества пере­вода и снижения его стоимости — но ведь то же самое говорится и о переводах, выполняемых человеком. Так что в единственно разумном смысле этого выражения „эпоха" МП и ЧМП уже „насту­пила". С дальнейшим улучшением качества и снижением стоимости машинного перевода — и то и другое наверняка не замедлит после­довать— системы (Ч)МП получат еще большее признание.

Система SYSTRAN

Система SYSTRAN явилась одной из первых систем МП, полу­чивших коммерческое значение. Впервые она была установлена в 1970 г. в Отделе зарубежной технологии ВВС США, сменив в этом отделе русско-английскую систему Mark-П фирмы IBM; она про­должает использоваться там и до сих пор. В 1974 г. на систему SYSTRAN пал выбор руководства Национального управления США по аэронавтике и исследованию космического пространства (НАСА), которому она потребовалась в связи с задачей перевода материалов в рамках программы международного сотрудничества „Аполлон — Союз", а в 1976 г. система SYSTRAN была установлена вместо системы GAT в Евратоме. В том же 1976 г. в Отделе зарубежной технологии эта система была дополнена экранным редактором, что позволило увеличить ее производительность (в частности, за счет отказа от использования перфокарт).

Система продолжала совер­шенствоваться и в других направлениях — произошел, например, пе­реход к более модульному принципу ее построения, стали пре­дусматриваться тематические глоссарии (прежде всего словари, ори­ентированные на ту предметную область, к которой относится обрабатываемый текст). В литературе отмечался тот недостаток системы, что лингвистическое описание в ней строится ad hoc, осо­бенно в том, что касается приписывания словам семантических признаков (Р і g о 11, 1979). Словари Отдела зарубежной технологии насчитывают более миллиона единиц; в статье В о s t a d, 1982, указывается, что при пополнении и обновлении этих словарей должны соблюдаться строгие ограничения — с тем чтобы изменения, вно­симые в одну словарную статью, не приводили к дезорганизации работы других статей. (Согласно исследованию Уилкса (W і 1 k s,

1978) , соотношение случаев улучшения и ухудшения качества ра­боты системы в результате коррекции используемых в ней словарей составляет 7:3, однако Бостад имеет в виду гораздо большую стабильность, которая стала возможной благодаря введению жестких мер по контролю качества.)

В 1976 г. Комиссия европейских сообществ закупила англо­французскую версию системы SYSTRAN в целях ее оценки и по­тенциального использования. В отличие от Отдела зарубежной технологии, НАСА и Евратома Комиссия европейских сообществ планировала использовать данную систему не для сбора, а для распространения информации — имея в виду, разумеется, что, преж­де чем поступить к потребителю, результаты работы системы будут подвергаться тщательному постредактированию. Как указывается в Van Slype, 1982, «стандартный англо-французский словарь, пе­реданный в распоряжение Комиссии профессором П. Тома, оказался в ее условиях почти полностью бесполезным.» Первоначально систе­ма получила отрицательную оценку (см., например, Van Slype,

1979) , однако переводчики, работавшие в комиссии, были уже настолько перегружены и в перспективе эта перегрузка должна была настолько возрасти, что исследования были продолжены — в на­дежде на то, что путем пополнения словаря систему удастся усо­вершенствовать и довести до такого уровня, когда она станет пригодна для использования.

Были закуплены еще две версии системы SYSTRAN: французско-английская (в 1978 г.) и англо­итальянская (в 1979 г.). В конечном итоге мечты о том, чтобы получать переводы такого качества, которые допускали бы постредак­тирование, воплотились в жизнь: как сообщается в R і g о 11, 1982, «энтузиазм, который был проявлен [некоторыми переводчиками], указывает, по-видимому, на своего рода поворотный пункт [в исто­рии машинного перевода]». В настоящее время системой SYSTRAN, поставленной на компьютере Siemens-7740, пользуются в своей те­кущей работе около 20 переводчиков комиссии, работающих в Люк­сембурге. Достигнутый успех объясняется, в частности, тем, что объем английского и французского словарей для тех немногих отраслей техники, применительно к которым используется система SYSTRAN, существенно превысил теперь 100 000 единиц.

В том же 1976 г. канадский филиал корпорации „Дженерал моторе" („General Motors of Canada") приобрел систему SYSTRAN для перевода с английского языка на французский различных технических руководств и инструкций (по обслуживанию транспорт­ных средств, по эксплуатации и обслуживанию тепловозов, а также по обслуживанию фургонов для автодорожных перевозок) с ис­пользованием основной модели ЭВМ фирмы IBM. Англо-француз­ский словарь, входящий в состав этой системы, был значительно расширен; к 1981 г. его объем превысил 130 000 терминов (Sereda, 1981). Впоследствии „Дженерал моторе" закупила англо-испанскую версию системы SYSTRAN и приступила к созданию требуемого (очень большого) словаря. В работе Sereda, 1982, сообщается, что использование системы SYSTRAN позволило увеличить произ­водительность труда переводчиков в 3—4 раза (по сравнению с прежним уровнем, составлявшим около 1000 слов в день); там же приводятся сведения о том, что подготовка словарных статей для системы SYSTRAN обходится компании примерно в 4 доллара за единицу (то есть за слово или идиоматическое выражение в соче­тании с его переводным эквивалентом).

В то время как другие пользователи системы SYSTRAN при­меняли ее (в рамках выбранных ими предметных областей) для перевода текстов, на которые не налагалось заранее никаких лингви­стических ограничений, фирма „Xerox", проконсультировавшись с компанией „LATSEC", разработала систему ограничений на входной язык, определив тем самым так называемый Multinational Customized English (английский язык, адаптированный для многонационального использования); то есть эта фирма требует от своих сотрудников, чтобы при составлении технической документации на английском языке они придерживались специализированного словаря и строгих стилистических правил.

Затем полученная документация переводится с помощью системы SYSTRAN на французский, итальянский, ис­панский, немецкий и португальский языки. Согласно Руффино (см. R u f f і п о, 1982), это дает «для большинства текстов пятикратный выигрыш в скорости перевода»; в зависимости от конкретного текста она увеличивается минимум в два, максимум в 10 раз. Возможно, что такой подход приемлем не для всех организаций, но фирма ,,Xerox" пользуется им весьма охотно, заявляя, что тем самым обеспе­чивается также большая понятность исходных текстов.

В настоящее время система SYSTRAN применяется в Комиссии Европейских Сообществ для перевода текущей документации с анг­лийского языка на французский, с французского на английский и с английского на итальянский (получаемые переводы затем постре­дактируются человеком); общий объем обрабатываемых текстов составляет около 1000 страниц в месяц (W heeler, 1983). Учитывая эти относительно успешные результаты использования системы SYSTRAN в рамках требуемых задач, Комиссия приняла недавно решение о закупке также англо-немецкой и французско-немецкой версий той же системы. Судя по предыдущему опыту, для промы­шленного использования они будут готовы еще очень не скоро, но зато можно рассчитывать, что после этого бюро переводов Комиссии Европейских Сообществ сможет благодаря их работе сэкономить дорогое для него время, а возможно, сократить и денежные расходы.

Система LOGOS

Разработка системы LOGOS началась в 1964 г. В промышленных масштабах ее впервые начали применять в 1971 г. в ВВС США для перевода с английского на вьетнамский язык руководств по техни­ческому обслуживанию военной техники. Через два года, после пре­кращения военных действий США во Вьетнаме, система эксплуатиро­ваться перестала. В статье Sinaiko-Klare, 1973, утверждалось, что система LOGOS нерентабельна в экономическом отношении, од­нако это утверждение было официально опротестовано как содержа­щее серьезные неточности (Б. Скотт, устное сообщение). О лингви­стических принципах, на которые опирается система LOGOS, из­вестно очень мало: это считается, по-видимому, коммерческой тайной.

Как указывает автор системы, «В разработке своего лингвисти­ческого подхода... мы шли в направлении, аналогичном падежной грамматике или теории валентностей..., сопоставляя естественно­языковым текстам их представления на языке семантико-синтакси- ческих абстракций, организованные в виде деревьев» (Б. Скотт, устное сообщение).

Интерес потребителей к системе LOGOS сохранялся. В 1978 г. корпорация „Siemens AG" начала финансировать работы по созда­нию немецко-английской версии системы LOGOS, ориентированной на перевод руководств по средствам дистанционной связи. Через три года эта версия была доведена до уровня „промышленной" системы, однако заказчики не сочли ее пригодной для эксплуатации (от­части по причине низкого качества переводов, а отчасти в связи с изменением экономического положения самой корпорации, которое привело к резкому снижению потребностей в переводе; в резуль­тате отпала нужда и в непосредственном использовании систе­мы МП). В конце концов группа LOGOS заключила соглашение с компанией „Wang", в рамках которого немецко-английская система (работавшая ранее только на крупногабаритных ЭВМ основных моделей, выпускаемых корпорацией „IBM") была реализована на конторских компьютерах фирмы „Wang". Данная версия системы поступила в продажу и была закуплена несколькими транснациональ­ными корпорациями (в том числе такими, как „Nixdorf", „Triumph- Adler", „Hewlett-Packard"); в настоящее время ведется работа над англо-французской, англо-немецкой и другими версиями системы LOGOS (Б. Скотт, устное сообщение).

Система МЕТЕО

Система TAUM-METEO — это пока единственная в мире пол­ностью автоматическая система МП. Как уже говорилось, она была создана на основе технологии, разработанной в рамках проекта TAUM, в качестве побочного результата исследований по этому проекту. К 1977 г. данная система была полностью интегрирована в общегосударственную сеть метеорологического оповещения Ка­надского метеорологического центра (КМЦ). На вход системы МЕ­ТЕО подается весь поток метеорологических сообщений, поступаю­щих в эту сеть, система выделяет в нем сообщения, написанные по- английски, переводит их „прямым" способом на французский язык и вновь автоматически подает полученные переводы в общую сеть. Просмотр переводов постредактором-человеком, который бы обнару­живал и исправлял допущенные в них ошибки, не предусматри­вается; вместо этого система МЕТЕО осуществляет автоматическое выявление своих ошибок и передает редакторам только те тексты, с которыми она не справилась; переводы, которые расцениваются системой как „правильные", поступают в каналы связи без вме­шательства человека и даже без какого-либо контроля с его стороны.

Система TAUM-METEO явилась также, по-видимому, первой системой МП, в проектировании, разработке и окончательной доводке которой были на всех этапах задействованы переводчики; даже сама идея этой системы была подана одним из переводчиков КМЦ. Поскольку те ограничения, в рамках которых должны форму­лироваться исходные тексты, были введены еще до начала работы над системой МЕТЕО (то есть соблюдения каких-либо новых огра­ничений непосредственно в связи с ее использованием от соста­вителей прогнозов погоды не потребовалось), данную систему нельзя считать вполне аналогичной системе SYSTRAN в том варианте, в котором ее использует фирма „Xerox", когда на входные тексты на­лагаются ограничения, определяемые особенностями системы как та­ковой. Однако система МЕТЕО не может быть расширена в рас­чете на какой-либо иной тип текстов, хотя, по-видимому, аналогичные системы могут быть построены и для других, столь же ограниченных типов текстов, если таковые найдутся.

Ввод в эксплуатацию системы МЕТЕО имел, среди прочих, тот весьма примечательный побочный эффект, что после того, как переводчики КМЦ стали доверять решениям, принимаемым в ходе обработки текстов системой МЕТЕО, и отказались от сплошного просмотра выдаваемых ею результатов, текучесть кадров среди них резко упала: если до внедрения этой системы переводчики рабо­тали в КМЦ в среднем по полгода, то теперь — по нескольку лет (Брайан Хэррис, устное сообщение). Объем входных текстов, переводимых системой МЕТЕО, составляет более 24 ООО слов в день, или 8,5 миллиона, слов в год. Из этого объема правильно пере­водится в настоящее время 90—95%, а остальные 5—10% текстов („более интересные") передаются для перевода людям — сотрудни­кам КМЦ. Почти все эти случаи, когда текст „не поддается анализу", связаны либо с информационными шумами (при передаче сообщений по каналам связи в сети КМЦ в части этих сообщений могут возникать искажения), либо с орфографическими непра­вильностями (в системе МЕТЕО не предусмотрена коррекция входно­го текста), либо с отсутствием нужных слов в словаре; но иногда отказы бывают обусловлены и тем, что в системе не учтены встре­тившиеся в тексте лингвистические конструкции. На ЭВМ типа CDC 7600 затраты машинного времени составляют для системы МЕТЕО около 15 минут в день (имеется в виду время работы центрального процессора) (Т h о и і п, 1982). К 1981 г. был, судя по всему, достигнут предел тех возможностей, которые были заложены в теоретической модели, составляющей основу системы МЕТЕО, и дальнейшее совершенствование системы стало, по-видимому, не­рентабельным.

Семейство систем корпорации „Weidner Communications"

Корпорация „Weidner" была создана в 1977 г. Брусом Уэйднером, который вскоре взял на работу нескольких программистов, специали­зирующихся в области МП и работавших до этого в рамках посте­пенно сворачиваемого проекта BYU. В 1980 г. корпорация поста­вила промышленную англо-французскую систему канадской фирме „Mitel" и экспериментальную (beta-test) англо-испанскую систему — корпорации „Siemens" (США). В 1981 г. фирме „Mitel" были постав­лены англо-испанская и англо-немецкая системы корпорации „Weid­ner", а фирма „Bravice" (одно из японских бюро переводческого обслуживания) закупила англо-испанскую и испанско-английскую системы этой корпорации. К настоящему времени системы МП, раз­работанные корпорацией „Weidner", установлены по меньшей мере в 22 организациях. Хотя процесс перевода в системах данного се­мейства и является полностью автоматическим, в коммерческом опи­сании они характеризуются как «машинное средство в помощь переводчику» (быть может, для того, чтобы избежать тех отри­цательных ассоциаций, которые вызывает обычно термин „машин­ный перевод" МП). В других отношениях (в том, что касается предварительного лексического анализа текстов, построения слова­рей и т. п.) для систем корпорации „Weidner" характерна высокая степень интерактивности, а в целях повышения общей эффектив­ности подготовки документации в них предусмотрена возможность интеграции программных средств экранного редактирования с раз­личным периферийным оборудованием (например, с лазерным прин­тером Xerox 9700, используемым фирмой „Mitel"). В частности, если на вход системы поступают документы, имеющие определенный формат (то есть практически снабженные кодировкой, которая задает способ их форматирования или набора), то их переводы могут выдаваться в том же формате. Для пользователей это весьма существенно, поскольку все они заинтересованы в получении для сформатированных входных текстов сформатированных же пере­водов.

При столь тесной интеграции систем корпорации „Weidner" с современными средствами экранного редактирования и форматиро­вания текстов трудно точно определить, в какой мере повышение производительности труда переводчика может быть отнесено за счет того компонента этих систем, с помощью которого осуществляется перевод как таковой, а в какой мере оно обусловлено просто автоматизацией ряда операций, которые ранее производились вруч­ную или были автоматизированы в недостаточной степени. Компо­нент, обеспечивающий автоматизацию самого процесса перевода, основан в рассматриваемых системах на прямом подходе к орга­низации этого процесса и не отличается особой утонченностью. Анализ, в частности, производится локальным способом и ограничен, как правило, уровнем именных и глагольных групп (исключение делается только для японского языка) — так что ту контекстуальную информацию, которая может быть извлечена только на более высоких уровнях, системы данного семейства учитывать не могут.

Процесс перевода разбит на четыре независимых этапа: снятие омографии, идентификация идиом, структурный анализ и межъязы­ковые операции. Взаимодействие между этими этапами не пре­дусматривается, что создает дополнительные трудности; например, омография разрешается раз и навсегда на очень ранних стадиях анализа, и никакие сведения о контексте более высокого уровня при этом не учитываются (они извлекаются позднее), хотя учет таких сведений позволил бы значительно расширить возможности со­ответствующих процедур. Сходные замечания высказываются в ра­боте Н u n d t, 1982, где, в частности, говорится: «Исключительно важную роль играет в процессе перевода обработка идиом... человеко-машинный перевод сводится большей частью к замене отдельных слов их переводными эквивалентами...» — и далее: «Осо­бенно глубоко вдаваться в рассмотрение тех различных проблем, которые встают при использовании систем [корпорации „Weidner"], не имеет смысла хотя бы уже потому, что их слишком много...». И тем не менее при всем том, что переводы, получаемые с по­мощью систем корпорации „Weidner", имеют весьма низкое качество, в экономическом отношении результаты работы этих систем, по отзывам пользователей, вполне удовлетворительны. Как указывается в той же работе (Н u n d t, 1982), «...системы корпорации „Weidner", действительно, работают как средство помощи переводчику...» и при их использовании «вполне реально получить [для общей произво­дительности перевода] такую конечную цифру, как 800 слов в час». Прежними методами (то есть только за счет человеческих возмож­ностей) подобной результативности достигнуть не удавалось. Ряд пользователей сообщают также, что в их условиях эксплуатация систем корпорации „Weidner" не только обеспечивает повышение скорости перевода, но и оказывается экономически рентабельной.

В 1982 г. англо-немецкая и немецко-английская системы корпо­рации „Weidner" были поставлены фирме „1ТТ" (Великобритания); однако корпорация испытывала определенные финансовые затрудне­ния (треть ее сотрудников были в тот год уволены), и в 1983 г. контрольный пакет акций этой корпорации приобрела японская компания „Bravice", ранее являвшаяся одним из ее клиентов. В настоящее время корпорация „Weidner" продолжает продавать свои прежние системы МП, а также ведет разработку систем, ориенти­рованных на японский язык. Недавно фирма „Bravice" сообщила о создании коммерческой системы японско-английского МП; продол­жается работа и над англо-японской системой. Кроме того, чтобы в меньшей степени зависеть от какого-либо конкретного типа ЭВМ вообще и от PDP-11 в частности, корпорация „Weidner" предпри­няла реализацию своих систем на базе персональных компьютеров типа IBM PC. Программное обеспечение систем данного семейства написано на языке программирования ФОРТРАН с частичным ис­пользованием также языка ассемблера, однако в целях повышения гибкости этого программного обеспечения его планируется пере­писать на другом языке программирования.

Система SPAN AM[49]

В 1975 г. Панамериканская организация здравоохранения (РАНО), штаб-квартира которой расположена в Вашингтоне (округ Колумбия), проведя соответствующие технико-экономические иссле­дования и получив обнадеживающие результаты, приняла решение о начале работ над системой машинного перевода, частично ос­нованной на той же методике, что и система GAT. В РАНО используется 4 официальных языка: английский, французский, порту­гальский и испанский; первоначальные разработки было решено проводить для испанского и английского языков в предположении, что «для этой пары языков приемлемые результаты могут быть получены с использованием менее сложной стратегии анализа, [а также по ряду других соображений, сводящихся в основном к тому, что лучше тратить силы на программное обеспечение, чем на составление лингвистических правил»]. (Va sconcellos, 1983). Конкретная работа началась в 1976 г., а в 1979 г. вступила в действие первая система-прототип, реализованная на базе основной конфигурации ЭВМ фирмы „IBM" с использованием ввода информа­ции с перфокарт. Последующее подключение к ней системы экран­ного редактирования позволило всерьез поставить вопрос о ее про­мышленной эксплуатации.

После того как система SPANAM прошла некоторую дополни­тельную доводку, она была использована для создания в 1980 г. в Панамериканской организации здравоохранения внутриведомст­венной переводческой службы. Первое крупное испытание системы, состоявшееся в конце того же года, показало, что применительно к тем материалам, которые переводились в ходе этого испытания, использование данной системы позволило сократить потребность в переводческом персонале на 45%, благодаря чему финансовые затраты снизились на 61% (Vasconcellos, 1983). (Эти цифры получены, насколько можно судить, сопоставлением той ситуации, когда перевод осуществляется с помощью системы SPANAM и далее постредактируется в режиме „он-лайн", с ранее принятой в РАНО чисто традиционной процедурой подготовки переводов в машино­писном виде без каких-либо средств автоматизации. Выигрыш, получаемый от использования системы SPANAM как таковой, и те выгоды, которые дает работа в режиме „он-лайн", здесь, по-виДимо- му, совершенно не разграничены, так что установить, в какой мере рост производительности труда идет за счет самой системы SPANAM, представляется невозможным или, во всяком случае, весьма затруднительным.) Объем текстов, переведенных с помощью системы SPANAM, начиная с 1980 г. составляет более миллиона слов, что дает в среднем около 4000 слов в день на одного постредактора. За это время постредакторы выработали массу всяческих ухищрений для ускорения своей работы; кроме того, для оперирования с английскими текстами, выдаваемыми системой SPANAM, в подсистему экранного редактирования встроен ряд специальных функций, обеспечивающих обработку цепочек символов.

Отдельные детали, упоминаемые в сообщениях о системе SPANAM, относящихся к начальному периоду работ по ее созданию, позволяют сделать вывод, что в основу этой системы была положена та лингвистическая технология, которая сформировалась в рамках разработок по проекту GAT. Правила грамматики, судя по этим сообщениям, встраивались, как и в системе GAT, непосредственно в программное обеспечение системы. Само программное обеспечение построено на базе более современной технологии и предусматривает модульную организацию составляющих его программ. Система явля­ется достаточно грубой: используется прямая стратегия перевода, анализ осуществляется в рамках локального подхода и сводится к выявлению отдельных составляющих и придаточных; организован он в виде последовательности простейших этапов обработки (типа этапа снятия омографии), выполняемых независимо друг от друга,— опять-таки в духе джорджтаунской системы. В настоящее время систему SPANAM используют в своей текущей работе трое перевод­чиков — сотрудников РАНО.

С 1981 г. началась разработка следующей англо-испанской сис­темы — ENGSPAN,— которая также доведена уже до стадии про­мышленной эксплуатации. В этой системе реализована более про­двинутая методология (в частности, ATN-анализатор[50]), которая, возможно, будет частично перенесена и в систему SPANAM (по уст­ному сообщению М. Васконсельоса, в настоящее время «производит­ся капитальный ремонт» этой последней). Систему ENGSPAN уже используют в повседневной работе четверо переводчиков — сотруд­ников РАНО. Успешное внедрение этих двух систем дало основание приступить к разработке системы ENGPORT (выходным языком для которой является португальский). В будущем «ожидается, что все переводчики [в бюро языкового обслуживания РАНО] будут хотя бы часть своего времени уделять работе с МП, и в перечень служеб­ных обязанностей переводчика, рассылаемый по почте претендентам на эту должность, уже включены соответствующие требования». (Vasconcellos, устное сообщение).

Система CULT[51]

Из всех существующих систем человеко-машинного перевода сис­тема CULT используется, по-видимому, с наибольшим успехом. Разработка ее началась примерно в 1968 г. в Китайском университе­те Гонконга. Система предназначена для перевода на английский язык китайских математических и физических журналов, издаваемых в Пекине. Процедуры перевода отличаются высокой степенью интер­активности (или, во всяком случае, предполагают активное участие человека). Идея состояла в том, чтобы избежать необходимости постредактирования переводов за счет значительного предредакти- рования входных текстов и некоторого (неизвестно, насколько существенного) интерредактирования в ходе самого процесса пере­вода. Хотя в опубликованных сообщениях (Loh, 1976; 1978; 1979) много неясностей, очевидно, что от человека требуется, среди прочего, проставлять во входных текстах границы предложений и отдельных составляющих, а также указывать, где необходимо, в каком значении употреблено то или иное слово. (Неясно только, имеется ли в виду предредактирование как таковое или же речь идет о работе в интер­активном режиме.) Система CULT реализована на ЭВМ 1CL 1904А.

Начиная с 1975 г. данная система используется для перевода на английский язык журнала „Acta Mathematica Sinica", а с 1976 г.— также журнала „Acta Physica Sinica". Проблема ввода в машину китайских иероглифов решалась вначале путем их кодирования с помощью стандартного телеграфного кода, изобретенного еще в прошлом веке, и набивки закодированных входных данных на пер­фокарты. Однако в 1978 г. система была модернизирована и к ней было подключено оборудование, позволяющее осуществлять ввод данных, а также их пред- и постредактирование в режиме „он-лайн".

Остается неясным, насколько общий характер имеют те средства и методы обработки текстов, на которых базируется система CULT,— можно ли, например, применять эту систему для перевода текстов других типов. Непонятно также, насколько ее работа рентабельна — быть может, она продолжает использоваться в силу каких-то других причин? Неизвестно, наконец, ведутся ли все еще исследования в целях оптимизации данной системы или же она, аналогично системе МЕТЕО, допускает совершенствование только до определенного уровня, и этот уровень уже достигнут. В отсутствие ответов на все перечисленные вопросы — а возможно, и безотносительно к тому, каковы эти ответы,— система CULT может, по-видимому, действи­тельно служить примером успешно действующей системы ЧМП: постредактирование, которого требуют, по имеющимся сообщениям, выдаваемые ею результаты, ограничено лишь самыми тривиальными операциями, такими, как перенос в окончательный текст перевода некоторых непереводимых формул, цифр и т. д. Правда, в какой-то момент от переводчика требуется еще и некоторая правка, но она сводится, похоже, к уточнению времени глаголов и числа существи­тельных а также, возможно, к введению в текст отдельных служеб­ных слов (типа артиклей).

Фирма „ALPS" была создана в 1980 г. пятью бывшими сотрудни­ками Университета Бригема Янга, работавшими в нем в рамках про­екта ITS. Вначале в состав этой группы входили, по-видимому, в ос­новном лингвисты, заинтересованные в разработке машинных средств помощи переводчику (таких, как средства словарного поиска и подстановки вместо исходных слов их переводных эквивалентов); позже к ней присоединились практически все основные разработчики системы ITS (А. К. Мелби и М. Д. Тенни, устное сообщение). Новые системы, разработанные группой „ALPS", во всех отношениях интер­активны и не претендуют сколько-нибудь серьезным образом на осуществление перевода как такового; скорее это набор предоставля­емых переводчику программных средств, позволяющих автоматизи­ровать значительную часть операций, встречающихся в повседневной переводческой практике. Первоначально подобные системы созда­вались для тех пар языков, с которыми должна была работать система ITS в Университете Бригема Янга, то есть для перевода с английского на французский, немецкий, португальский и испанский языки. Впоследствии были сообщения о подключении также других языков (например, арабского), однако коммерческий статус систем, работающих с этими языками, пока неясен. В настоящее время фирма „ALPS" не только продает системы ЧМП, но имеет и собственное бюро переводческого обслуживания.

Для систем фирмы „ALPS" предусмотрена возможность их ис­пользования на любом из трех „уровней": на уровне многоязычного экранного редактирования и словарного поиска, на уровне послов­ного перевода (под „словом" здесь фактически понимается термин) и на уровне в значительной степени автоматизированного (хотя и предполагающего участие человека) пофразного перевода. Судя по проводившимся фирмой „ALPS" демонстрациям этих систем, а также по отзывам пользователей, для работы в третьем режиме они если и применяются, то очень редко. Таким образом, основной коммерческий продукт фирмы „ALPS" — это система экранного редактирования, работающая под управлением меню, плюс под­ключенный к ней словарь, работающий в режиме „он-лайн". Одной из первых организаций, обратившихся к услугам фирмы „ALPS", явилось коммерческое бюро переводов „Agnew TechTran", которое закупило систему этой фирмы для внутреннего пользования. Кроме него, системами фирмы „ALPS" пользуются такие компании, как „Xerox", „Computer Vision", „Control Data" (во Франции), „IBM" (в Италии) и „Hewlett-Packard" (в Мексике). Не так давно, после очередной перетряски в корпорации „Weidner Communications" (там был распущен коллектив, работавший в Прово), фирма „ALPS" приняла на работу большую группу бывших сотрудников этой корпо­рации; возможно, что фирма „ALPS" сама намерена взяться за разработку полностью автоматизированных систем МП.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме СОВРЕМЕННЫЕ ПРОМЫШЛЕННЫЕ СИСТЕМЫ: