ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн

СОВРЕМЕННЫЕ ПРОМЫШЛЕННЫЕ СИСТЕМЫ

В данном разделе мы рассмотрим наиболее значительные из тех систем (Ч)МП, которые эксплуатируются и/или имеются в продаже в настоящее время. Некоторые из них созданы на базе описанных выше „неудавшихся" систем, другие явились в основной своей части результатом успешной (то есть не прерывавшейся) работы над соответствующими проектами исследований и разработок в области МП.

Из числа полностью автоматизированных систем МП ниже будут описаны системы SYSTRAN, LOGOS, МЕТЕО, семейство систем корпорации „Weidner" и система SPANAN. Кроме того, будут рассмотрены системы человеко-машинного перевода CULT и ALPS. Большинство этих систем принято в эксплуатацию несколькими пользователями (исключение составляют системы МЕТЕО, SPANAN и CULT, для каждой из которых известен только один пользователь). Начало промышленной эксплуатации самой ранней из этих систем относится к 1970 г.

„Стандартный тип эксплуатации" — если принять, что Он существует,— предусматривает такие операции, как предредактирова- ние (в случаях, когда это необходимо), собственно перевод (в системах ЧМП осуществляемый с активным участием человека) и более или менее серьезное постредактирование. С точки зрения пользователя, степень приемлемости системы МП определяется количеством требуемого пред- и/или постредактирования (от этого в первую очередь зависит и стоимость). Как отмечается в Van Slype, 1982, «о приемлемости системы МП для переводчика-человека... можно, по-видимому, говорить в том случае, если объем правки (то есть постредактирования), требуемой для выдаваемых системой переводов, составляет менее 20% (менее одного исправления на каждые пять слов) и если переводчик может принимать участие в совершенствовании этой системы». Заметим, что скорость постредактирования растет по мере накопления опыта: в статье Р і g о 11, 1982, указывается, что «...чем больше переводчик работает с результатами МП, тем лучше он овладевает этим своим новым инструментом.

В некоторых случаях ему удается за несколько месяцев удвоить свою производительность, благодаря тому что он начинает распознавать типовые ошибки МП и находить более эффективные способы их исправления.»

Важно также иметь в виду, что, хотя ни одна из имеющихся систем не позволяет получать переводы, сравнимые по качеству с переводами (во всяком случае, с хорошими переводами), выполненными человеком, пользователи этих систем считают достаточно целесообразным продолжать ими пользоваться. Более того, некоторые пользователи приобретают их повторно. Короче говоря, нельзя утверждать, будто системы МП и ЧМП не работают, поскольку на самом деле их покупают и эксплуатируют, и их пользователи экономят на этом свое время и/или средства. Каждый пользователь указывает, разумеется, на желательность повышения качества перевода и снижения его стоимости — но ведь то же самое говорится и о переводах, выполняемых человеком. Так что в единственно разумном смысле этого выражения „эпоха" МП и ЧМП уже „наступила". С дальнейшим улучшением качества и снижением стоимости машинного перевода — и то и другое наверняка не замедлит последовать— системы (Ч)МП получат еще большее признание.

Система SYSTRAN

Система SYSTRAN явилась одной из первых систем МП, получивших коммерческое значение. Впервые она была установлена в 1970 г. в Отделе зарубежной технологии ВВС США, сменив в этом отделе русско-английскую систему Mark-П фирмы IBM; она продолжает использоваться там и до сих пор. В 1974 г. на систему SYSTRAN пал выбор руководства Национального управления США по аэронавтике и исследованию космического пространства (НАСА), которому она потребовалась в связи с задачей перевода материалов в рамках программы международного сотрудничества „Аполлон — Союз", а в 1976 г. система SYSTRAN была установлена вместо системы GAT в Евратоме. В том же 1976 г. в Отделе зарубежной технологии эта система была дополнена экранным редактором, что позволило увеличить ее производительность (в частности, за счет отказа от использования перфокарт).

Система продолжала совершенствоваться и в других направлениях — произошел, например, переход к более модульному принципу ее построения, стали предусматриваться тематические глоссарии (прежде всего словари, ориентированные на ту предметную область, к которой относится обрабатываемый текст). В литературе отмечался тот недостаток системы, что лингвистическое описание в ней строится ad hoc, особенно в том, что касается приписывания словам семантических признаков (Р і g о 11, 1979). Словари Отдела зарубежной технологии насчитывают более миллиона единиц; в статье В о s t a d, 1982, указывается, что при пополнении и обновлении этих словарей должны соблюдаться строгие ограничения — с тем чтобы изменения, вносимые в одну словарную статью, не приводили к дезорганизации работы других статей. (Согласно исследованию Уилкса (W і 1 k s,

1978) , соотношение случаев улучшения и ухудшения качества работы системы в результате коррекции используемых в ней словарей составляет 7:3, однако Бостад имеет в виду гораздо большую стабильность, которая стала возможной благодаря введению жестких мер по контролю качества.)

В 1976 г. Комиссия европейских сообществ закупила англофранцузскую версию системы SYSTRAN в целях ее оценки и потенциального использования. В отличие от Отдела зарубежной технологии, НАСА и Евратома Комиссия европейских сообществ планировала использовать данную систему не для сбора, а для распространения информации — имея в виду, разумеется, что, прежде чем поступить к потребителю, результаты работы системы будут подвергаться тщательному постредактированию. Как указывается в Van Slype, 1982, «стандартный англо-французский словарь, переданный в распоряжение Комиссии профессором П. Тома, оказался в ее условиях почти полностью бесполезным.» Первоначально система получила отрицательную оценку (см., например, Van Slype,

1979) , однако переводчики, работавшие в комиссии, были уже настолько перегружены и в перспективе эта перегрузка должна была настолько возрасти, что исследования были продолжены — в надежде на то, что путем пополнения словаря систему удастся усовершенствовать и довести до такого уровня, когда она станет пригодна для использования.

Были закуплены еще две версии системы SYSTRAN: французско-английская (в 1978 г.) и англоитальянская (в 1979 г.). В конечном итоге мечты о том, чтобы получать переводы такого качества, которые допускали бы постредактирование, воплотились в жизнь: как сообщается в R і g о 11, 1982, «энтузиазм, который был проявлен [некоторыми переводчиками], указывает, по-видимому, на своего рода поворотный пункт [в истории машинного перевода]». В настоящее время системой SYSTRAN, поставленной на компьютере Siemens-7740, пользуются в своей текущей работе около 20 переводчиков комиссии, работающих в Люксембурге. Достигнутый успех объясняется, в частности, тем, что объем английского и французского словарей для тех немногих отраслей техники, применительно к которым используется система SYSTRAN, существенно превысил теперь 100 000 единиц.

В том же 1976 г. канадский филиал корпорации „Дженерал моторе" („General Motors of Canada") приобрел систему SYSTRAN для перевода с английского языка на французский различных технических руководств и инструкций (по обслуживанию транспортных средств, по эксплуатации и обслуживанию тепловозов, а также по обслуживанию фургонов для автодорожных перевозок) с использованием основной модели ЭВМ фирмы IBM. Англо-французский словарь, входящий в состав этой системы, был значительно расширен; к 1981 г. его объем превысил 130 000 терминов (Sereda, 1981). Впоследствии „Дженерал моторе" закупила англо-испанскую версию системы SYSTRAN и приступила к созданию требуемого (очень большого) словаря. В работе Sereda, 1982, сообщается, что использование системы SYSTRAN позволило увеличить производительность труда переводчиков в 3—4 раза (по сравнению с прежним уровнем, составлявшим около 1000 слов в день); там же приводятся сведения о том, что подготовка словарных статей для системы SYSTRAN обходится компании примерно в 4 доллара за единицу (то есть за слово или идиоматическое выражение в сочетании с его переводным эквивалентом).

В то время как другие пользователи системы SYSTRAN применяли ее (в рамках выбранных ими предметных областей) для перевода текстов, на которые не налагалось заранее никаких лингвистических ограничений, фирма „Xerox", проконсультировавшись с компанией „LATSEC", разработала систему ограничений на входной язык, определив тем самым так называемый Multinational Customized English (английский язык, адаптированный для многонационального использования); то есть эта фирма требует от своих сотрудников, чтобы при составлении технической документации на английском языке они придерживались специализированного словаря и строгих стилистических правил.

Затем полученная документация переводится с помощью системы SYSTRAN на французский, итальянский, испанский, немецкий и португальский языки. Согласно Руффино (см. R u f f і п о, 1982), это дает «для большинства текстов пятикратный выигрыш в скорости перевода»; в зависимости от конкретного текста она увеличивается минимум в два, максимум в 10 раз. Возможно, что такой подход приемлем не для всех организаций, но фирма ,,Xerox" пользуется им весьма охотно, заявляя, что тем самым обеспечивается также большая понятность исходных текстов.

В настоящее время система SYSTRAN применяется в Комиссии Европейских Сообществ для перевода текущей документации с английского языка на французский, с французского на английский и с английского на итальянский (получаемые переводы затем постредактируются человеком); общий объем обрабатываемых текстов составляет около 1000 страниц в месяц (W heeler, 1983). Учитывая эти относительно успешные результаты использования системы SYSTRAN в рамках требуемых задач, Комиссия приняла недавно решение о закупке также англо-немецкой и французско-немецкой версий той же системы. Судя по предыдущему опыту, для промышленного использования они будут готовы еще очень не скоро, но зато можно рассчитывать, что после этого бюро переводов Комиссии Европейских Сообществ сможет благодаря их работе сэкономить дорогое для него время, а возможно, сократить и денежные расходы.

Система LOGOS

Разработка системы LOGOS началась в 1964 г. В промышленных масштабах ее впервые начали применять в 1971 г. в ВВС США для перевода с английского на вьетнамский язык руководств по техническому обслуживанию военной техники. Через два года, после прекращения военных действий США во Вьетнаме, система эксплуатироваться перестала. В статье Sinaiko-Klare, 1973, утверждалось, что система LOGOS нерентабельна в экономическом отношении, однако это утверждение было официально опротестовано как содержащее серьезные неточности (Б. Скотт, устное сообщение). О лингвистических принципах, на которые опирается система LOGOS, известно очень мало: это считается, по-видимому, коммерческой тайной.

Как указывает автор системы, «В разработке своего лингвистического подхода... мы шли в направлении, аналогичном падежной грамматике или теории валентностей..., сопоставляя естественноязыковым текстам их представления на языке семантико-синтакси- ческих абстракций, организованные в виде деревьев» (Б. Скотт, устное сообщение).

Интерес потребителей к системе LOGOS сохранялся. В 1978 г. корпорация „Siemens AG" начала финансировать работы по созданию немецко-английской версии системы LOGOS, ориентированной на перевод руководств по средствам дистанционной связи. Через три года эта версия была доведена до уровня „промышленной" системы, однако заказчики не сочли ее пригодной для эксплуатации (отчасти по причине низкого качества переводов, а отчасти в связи с изменением экономического положения самой корпорации, которое привело к резкому снижению потребностей в переводе; в результате отпала нужда и в непосредственном использовании системы МП). В конце концов группа LOGOS заключила соглашение с компанией „Wang", в рамках которого немецко-английская система (работавшая ранее только на крупногабаритных ЭВМ основных моделей, выпускаемых корпорацией „IBM") была реализована на конторских компьютерах фирмы „Wang". Данная версия системы поступила в продажу и была закуплена несколькими транснациональными корпорациями (в том числе такими, как „Nixdorf", „Triumph- Adler", „Hewlett-Packard"); в настоящее время ведется работа над англо-французской, англо-немецкой и другими версиями системы LOGOS (Б. Скотт, устное сообщение).

Система МЕТЕО

Система TAUM-METEO — это пока единственная в мире полностью автоматическая система МП. Как уже говорилось, она была создана на основе технологии, разработанной в рамках проекта TAUM, в качестве побочного результата исследований по этому проекту. К 1977 г. данная система была полностью интегрирована в общегосударственную сеть метеорологического оповещения Канадского метеорологического центра (КМЦ). На вход системы МЕТЕО подается весь поток метеорологических сообщений, поступающих в эту сеть, система выделяет в нем сообщения, написанные по- английски, переводит их „прямым" способом на французский язык и вновь автоматически подает полученные переводы в общую сеть. Просмотр переводов постредактором-человеком, который бы обнаруживал и исправлял допущенные в них ошибки, не предусматривается; вместо этого система МЕТЕО осуществляет автоматическое выявление своих ошибок и передает редакторам только те тексты, с которыми она не справилась; переводы, которые расцениваются системой как „правильные", поступают в каналы связи без вмешательства человека и даже без какого-либо контроля с его стороны.

Система TAUM-METEO явилась также, по-видимому, первой системой МП, в проектировании, разработке и окончательной доводке которой были на всех этапах задействованы переводчики; даже сама идея этой системы была подана одним из переводчиков КМЦ. Поскольку те ограничения, в рамках которых должны формулироваться исходные тексты, были введены еще до начала работы над системой МЕТЕО (то есть соблюдения каких-либо новых ограничений непосредственно в связи с ее использованием от составителей прогнозов погоды не потребовалось), данную систему нельзя считать вполне аналогичной системе SYSTRAN в том варианте, в котором ее использует фирма „Xerox", когда на входные тексты налагаются ограничения, определяемые особенностями системы как таковой. Однако система МЕТЕО не может быть расширена в расчете на какой-либо иной тип текстов, хотя, по-видимому, аналогичные системы могут быть построены и для других, столь же ограниченных типов текстов, если таковые найдутся.

Ввод в эксплуатацию системы МЕТЕО имел, среди прочих, тот весьма примечательный побочный эффект, что после того, как переводчики КМЦ стали доверять решениям, принимаемым в ходе обработки текстов системой МЕТЕО, и отказались от сплошного просмотра выдаваемых ею результатов, текучесть кадров среди них резко упала: если до внедрения этой системы переводчики работали в КМЦ в среднем по полгода, то теперь — по нескольку лет (Брайан Хэррис, устное сообщение). Объем входных текстов, переводимых системой МЕТЕО, составляет более 24 ООО слов в день, или 8,5 миллиона, слов в год. Из этого объема правильно переводится в настоящее время 90—95%, а остальные 5—10% текстов („более интересные") передаются для перевода людям — сотрудникам КМЦ. Почти все эти случаи, когда текст „не поддается анализу", связаны либо с информационными шумами (при передаче сообщений по каналам связи в сети КМЦ в части этих сообщений могут возникать искажения), либо с орфографическими неправильностями (в системе МЕТЕО не предусмотрена коррекция входного текста), либо с отсутствием нужных слов в словаре; но иногда отказы бывают обусловлены и тем, что в системе не учтены встретившиеся в тексте лингвистические конструкции. На ЭВМ типа CDC 7600 затраты машинного времени составляют для системы МЕТЕО около 15 минут в день (имеется в виду время работы центрального процессора) (Т h о и і п, 1982). К 1981 г. был, судя по всему, достигнут предел тех возможностей, которые были заложены в теоретической модели, составляющей основу системы МЕТЕО, и дальнейшее совершенствование системы стало, по-видимому, нерентабельным.

Семейство систем корпорации „Weidner Communications"

Корпорация „Weidner" была создана в 1977 г. Брусом Уэйднером, который вскоре взял на работу нескольких программистов, специализирующихся в области МП и работавших до этого в рамках постепенно сворачиваемого проекта BYU. В 1980 г. корпорация поставила промышленную англо-французскую систему канадской фирме „Mitel" и экспериментальную (beta-test) англо-испанскую систему — корпорации „Siemens" (США). В 1981 г. фирме „Mitel" были поставлены англо-испанская и англо-немецкая системы корпорации „Weidner", а фирма „Bravice" (одно из японских бюро переводческого обслуживания) закупила англо-испанскую и испанско-английскую системы этой корпорации. К настоящему времени системы МП, разработанные корпорацией „Weidner", установлены по меньшей мере в 22 организациях. Хотя процесс перевода в системах данного семейства и является полностью автоматическим, в коммерческом описании они характеризуются как «машинное средство в помощь переводчику» (быть может, для того, чтобы избежать тех отрицательных ассоциаций, которые вызывает обычно термин „машинный перевод" МП). В других отношениях (в том, что касается предварительного лексического анализа текстов, построения словарей и т. п.) для систем корпорации „Weidner" характерна высокая степень интерактивности, а в целях повышения общей эффективности подготовки документации в них предусмотрена возможность интеграции программных средств экранного редактирования с различным периферийным оборудованием (например, с лазерным принтером Xerox 9700, используемым фирмой „Mitel"). В частности, если на вход системы поступают документы, имеющие определенный формат (то есть практически снабженные кодировкой, которая задает способ их форматирования или набора), то их переводы могут выдаваться в том же формате. Для пользователей это весьма существенно, поскольку все они заинтересованы в получении для сформатированных входных текстов сформатированных же переводов.

При столь тесной интеграции систем корпорации „Weidner" с современными средствами экранного редактирования и форматирования текстов трудно точно определить, в какой мере повышение производительности труда переводчика может быть отнесено за счет того компонента этих систем, с помощью которого осуществляется перевод как таковой, а в какой мере оно обусловлено просто автоматизацией ряда операций, которые ранее производились вручную или были автоматизированы в недостаточной степени. Компонент, обеспечивающий автоматизацию самого процесса перевода, основан в рассматриваемых системах на прямом подходе к организации этого процесса и не отличается особой утонченностью. Анализ, в частности, производится локальным способом и ограничен, как правило, уровнем именных и глагольных групп (исключение делается только для японского языка) — так что ту контекстуальную информацию, которая может быть извлечена только на более высоких уровнях, системы данного семейства учитывать не могут.

Процесс перевода разбит на четыре независимых этапа: снятие омографии, идентификация идиом, структурный анализ и межъязыковые операции. Взаимодействие между этими этапами не предусматривается, что создает дополнительные трудности; например, омография разрешается раз и навсегда на очень ранних стадиях анализа, и никакие сведения о контексте более высокого уровня при этом не учитываются (они извлекаются позднее), хотя учет таких сведений позволил бы значительно расширить возможности соответствующих процедур. Сходные замечания высказываются в работе Н u n d t, 1982, где, в частности, говорится: «Исключительно важную роль играет в процессе перевода обработка идиом... человеко-машинный перевод сводится большей частью к замене отдельных слов их переводными эквивалентами...» — и далее: «Особенно глубоко вдаваться в рассмотрение тех различных проблем, которые встают при использовании систем [корпорации „Weidner"], не имеет смысла хотя бы уже потому, что их слишком много...». И тем не менее при всем том, что переводы, получаемые с помощью систем корпорации „Weidner", имеют весьма низкое качество, в экономическом отношении результаты работы этих систем, по отзывам пользователей, вполне удовлетворительны. Как указывается в той же работе (Н u n d t, 1982), «...системы корпорации „Weidner", действительно, работают как средство помощи переводчику...» и при их использовании «вполне реально получить [для общей производительности перевода] такую конечную цифру, как 800 слов в час». Прежними методами (то есть только за счет человеческих возможностей) подобной результативности достигнуть не удавалось. Ряд пользователей сообщают также, что в их условиях эксплуатация систем корпорации „Weidner" не только обеспечивает повышение скорости перевода, но и оказывается экономически рентабельной.

В 1982 г. англо-немецкая и немецко-английская системы корпорации „Weidner" были поставлены фирме „1ТТ" (Великобритания); однако корпорация испытывала определенные финансовые затруднения (треть ее сотрудников были в тот год уволены), и в 1983 г. контрольный пакет акций этой корпорации приобрела японская компания „Bravice", ранее являвшаяся одним из ее клиентов. В настоящее время корпорация „Weidner" продолжает продавать свои прежние системы МП, а также ведет разработку систем, ориентированных на японский язык. Недавно фирма „Bravice" сообщила о создании коммерческой системы японско-английского МП; продолжается работа и над англо-японской системой. Кроме того, чтобы в меньшей степени зависеть от какого-либо конкретного типа ЭВМ вообще и от PDP-11 в частности, корпорация „Weidner" предприняла реализацию своих систем на базе персональных компьютеров типа IBM PC. Программное обеспечение систем данного семейства написано на языке программирования ФОРТРАН с частичным использованием также языка ассемблера, однако в целях повышения гибкости этого программного обеспечения его планируется переписать на другом языке программирования.

Система SPAN AM[49]

В 1975 г. Панамериканская организация здравоохранения (РАНО), штаб-квартира которой расположена в Вашингтоне (округ Колумбия), проведя соответствующие технико-экономические исследования и получив обнадеживающие результаты, приняла решение о начале работ над системой машинного перевода, частично основанной на той же методике, что и система GAT. В РАНО используется 4 официальных языка: английский, французский, португальский и испанский; первоначальные разработки было решено проводить для испанского и английского языков в предположении, что «для этой пары языков приемлемые результаты могут быть получены с использованием менее сложной стратегии анализа, [а также по ряду других соображений, сводящихся в основном к тому, что лучше тратить силы на программное обеспечение, чем на составление лингвистических правил»]. (Va sconcellos, 1983). Конкретная работа началась в 1976 г., а в 1979 г. вступила в действие первая система-прототип, реализованная на базе основной конфигурации ЭВМ фирмы „IBM" с использованием ввода информации с перфокарт. Последующее подключение к ней системы экранного редактирования позволило всерьез поставить вопрос о ее промышленной эксплуатации.

После того как система SPANAM прошла некоторую дополнительную доводку, она была использована для создания в 1980 г. в Панамериканской организации здравоохранения внутриведомственной переводческой службы. Первое крупное испытание системы, состоявшееся в конце того же года, показало, что применительно к тем материалам, которые переводились в ходе этого испытания, использование данной системы позволило сократить потребность в переводческом персонале на 45%, благодаря чему финансовые затраты снизились на 61% (Vasconcellos, 1983). (Эти цифры получены, насколько можно судить, сопоставлением той ситуации, когда перевод осуществляется с помощью системы SPANAM и далее постредактируется в режиме „он-лайн", с ранее принятой в РАНО чисто традиционной процедурой подготовки переводов в машинописном виде без каких-либо средств автоматизации. Выигрыш, получаемый от использования системы SPANAM как таковой, и те выгоды, которые дает работа в режиме „он-лайн", здесь, по-виДимо- му, совершенно не разграничены, так что установить, в какой мере рост производительности труда идет за счет самой системы SPANAM, представляется невозможным или, во всяком случае, весьма затруднительным.) Объем текстов, переведенных с помощью системы SPANAM, начиная с 1980 г. составляет более миллиона слов, что дает в среднем около 4000 слов в день на одного постредактора. За это время постредакторы выработали массу всяческих ухищрений для ускорения своей работы; кроме того, для оперирования с английскими текстами, выдаваемыми системой SPANAM, в подсистему экранного редактирования встроен ряд специальных функций, обеспечивающих обработку цепочек символов.

Отдельные детали, упоминаемые в сообщениях о системе SPANAM, относящихся к начальному периоду работ по ее созданию, позволяют сделать вывод, что в основу этой системы была положена та лингвистическая технология, которая сформировалась в рамках разработок по проекту GAT. Правила грамматики, судя по этим сообщениям, встраивались, как и в системе GAT, непосредственно в программное обеспечение системы. Само программное обеспечение построено на базе более современной технологии и предусматривает модульную организацию составляющих его программ. Система является достаточно грубой: используется прямая стратегия перевода, анализ осуществляется в рамках локального подхода и сводится к выявлению отдельных составляющих и придаточных; организован он в виде последовательности простейших этапов обработки (типа этапа снятия омографии), выполняемых независимо друг от друга,— опять-таки в духе джорджтаунской системы. В настоящее время систему SPANAM используют в своей текущей работе трое переводчиков — сотрудников РАНО.

С 1981 г. началась разработка следующей англо-испанской системы — ENGSPAN,— которая также доведена уже до стадии промышленной эксплуатации. В этой системе реализована более продвинутая методология (в частности, ATN-анализатор[50]), которая, возможно, будет частично перенесена и в систему SPANAM (по устному сообщению М. Васконсельоса, в настоящее время «производится капитальный ремонт» этой последней). Систему ENGSPAN уже используют в повседневной работе четверо переводчиков — сотрудников РАНО. Успешное внедрение этих двух систем дало основание приступить к разработке системы ENGPORT (выходным языком для которой является португальский). В будущем «ожидается, что все переводчики [в бюро языкового обслуживания РАНО] будут хотя бы часть своего времени уделять работе с МП, и в перечень служебных обязанностей переводчика, рассылаемый по почте претендентам на эту должность, уже включены соответствующие требования». (Vasconcellos, устное сообщение).

Система CULT[51]

Из всех существующих систем человеко-машинного перевода система CULT используется, по-видимому, с наибольшим успехом. Разработка ее началась примерно в 1968 г. в Китайском университете Гонконга. Система предназначена для перевода на английский язык китайских математических и физических журналов, издаваемых в Пекине. Процедуры перевода отличаются высокой степенью интерактивности (или, во всяком случае, предполагают активное участие человека). Идея состояла в том, чтобы избежать необходимости постредактирования переводов за счет значительного предредакти- рования входных текстов и некоторого (неизвестно, насколько существенного) интерредактирования в ходе самого процесса перевода. Хотя в опубликованных сообщениях (Loh, 1976; 1978; 1979) много неясностей, очевидно, что от человека требуется, среди прочего, проставлять во входных текстах границы предложений и отдельных составляющих, а также указывать, где необходимо, в каком значении употреблено то или иное слово. (Неясно только, имеется ли в виду предредактирование как таковое или же речь идет о работе в интерактивном режиме.) Система CULT реализована на ЭВМ 1CL 1904А.

Начиная с 1975 г. данная система используется для перевода на английский язык журнала „Acta Mathematica Sinica", а с 1976 г.— также журнала „Acta Physica Sinica". Проблема ввода в машину китайских иероглифов решалась вначале путем их кодирования с помощью стандартного телеграфного кода, изобретенного еще в прошлом веке, и набивки закодированных входных данных на перфокарты. Однако в 1978 г. система была модернизирована и к ней было подключено оборудование, позволяющее осуществлять ввод данных, а также их пред- и постредактирование в режиме „он-лайн".

Остается неясным, насколько общий характер имеют те средства и методы обработки текстов, на которых базируется система CULT,— можно ли, например, применять эту систему для перевода текстов других типов. Непонятно также, насколько ее работа рентабельна — быть может, она продолжает использоваться в силу каких-то других причин? Неизвестно, наконец, ведутся ли все еще исследования в целях оптимизации данной системы или же она, аналогично системе МЕТЕО, допускает совершенствование только до определенного уровня, и этот уровень уже достигнут. В отсутствие ответов на все перечисленные вопросы — а возможно, и безотносительно к тому, каковы эти ответы,— система CULT может, по-видимому, действительно служить примером успешно действующей системы ЧМП: постредактирование, которого требуют, по имеющимся сообщениям, выдаваемые ею результаты, ограничено лишь самыми тривиальными операциями, такими, как перенос в окончательный текст перевода некоторых непереводимых формул, цифр и т. д. Правда, в какой-то момент от переводчика требуется еще и некоторая правка, но она сводится, похоже, к уточнению времени глаголов и числа существительных а также, возможно, к введению в текст отдельных служебных слов (типа артиклей).

Фирма „ALPS" была создана в 1980 г. пятью бывшими сотрудниками Университета Бригема Янга, работавшими в нем в рамках проекта ITS. Вначале в состав этой группы входили, по-видимому, в основном лингвисты, заинтересованные в разработке машинных средств помощи переводчику (таких, как средства словарного поиска и подстановки вместо исходных слов их переводных эквивалентов); позже к ней присоединились практически все основные разработчики системы ITS (А. К. Мелби и М. Д. Тенни, устное сообщение). Новые системы, разработанные группой „ALPS", во всех отношениях интерактивны и не претендуют сколько-нибудь серьезным образом на осуществление перевода как такового; скорее это набор предоставляемых переводчику программных средств, позволяющих автоматизировать значительную часть операций, встречающихся в повседневной переводческой практике. Первоначально подобные системы создавались для тех пар языков, с которыми должна была работать система ITS в Университете Бригема Янга, то есть для перевода с английского на французский, немецкий, португальский и испанский языки. Впоследствии были сообщения о подключении также других языков (например, арабского), однако коммерческий статус систем, работающих с этими языками, пока неясен. В настоящее время фирма „ALPS" не только продает системы ЧМП, но имеет и собственное бюро переводческого обслуживания.

Для систем фирмы „ALPS" предусмотрена возможность их использования на любом из трех „уровней": на уровне многоязычного экранного редактирования и словарного поиска, на уровне пословного перевода (под „словом" здесь фактически понимается термин) и на уровне в значительной степени автоматизированного (хотя и предполагающего участие человека) пофразного перевода. Судя по проводившимся фирмой „ALPS" демонстрациям этих систем, а также по отзывам пользователей, для работы в третьем режиме они если и применяются, то очень редко. Таким образом, основной коммерческий продукт фирмы „ALPS" — это система экранного редактирования, работающая под управлением меню, плюс подключенный к ней словарь, работающий в режиме „он-лайн". Одной из первых организаций, обратившихся к услугам фирмы „ALPS", явилось коммерческое бюро переводов „Agnew TechTran", которое закупило систему этой фирмы для внутреннего пользования. Кроме него, системами фирмы „ALPS" пользуются такие компании, как „Xerox", „Computer Vision", „Control Data" (во Франции), „IBM" (в Италии) и „Hewlett-Packard" (в Мексике). Не так давно, после очередной перетряски в корпорации „Weidner Communications" (там был распущен коллектив, работавший в Прово), фирма „ALPS" приняла на работу большую группу бывших сотрудников этой корпорации; возможно, что фирма „ALPS" сама намерена взяться за разработку полностью автоматизированных систем МП.

<< | >>

↑

Источник: Б.Ю. Городецкий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городецкого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме СОВРЕМЕННЫЕ ПРОМЫШЛЕННЫЕ СИСТЕМЫ:

- Английский язык - Диалектология - Иностранные языки - История русского языка - Лексикология. Фразеология. Лексикография - Лингвокультура - Общая лингвистика - Общее языкознание - Русская филология - Русский язык - Синтаксис - Словообразование и морфология - Стилистика и культура речи - Украинский язык - Фонетика. Графика. Орфография -

- Архитектура и строительство - Безопасность жизнедеятельности - Библиотечное дело - Бизнес - Биология - Военные дисциплины - География - Геология - Демография - Диссертации России - Естествознание - Журналистика и СМИ - Информатика, вычислительная техника и управление - Искусствоведение - История - Культурология - Литература - Маркетинг - Математика - Медицина - Менеджмент - Педагогика - Политология - Право России - Право України - Промышленность - Психология - Реклама - Религиоведение - Социология - Страхование - Технические науки - Учебный процесс - Физика - Философия - Финансы - Химия - Художественные науки - Экология - Экономика - Энергетика - Юриспруденция - Языкознание -