ГЛАВНАЯ страница | Регистрация | Вход| RSS Пятница, 25.05.2018, 12:08

Удобное меню
  • ТЕСТЫ
  • В помощь учителям
  • В помощь изучающим
  • Родителям
  • Скачать
  • Развлечения
  • Нашим ученикам
  • ЕГЭ-2010-2011
  • Teachers' Cafe
  • Info
    Поиск
    Категории раздела
    Все для экзамена [1308]
    Информация
    фотообзоры

    Каталог статей

    Главная » Статьи » Все для экзамена » Все для экзамена

    ДЖ.ХАТЧИНС

    Сегодня наиболее известным авторитетом в области МП за рубежом является британский ученый Джон Хатчинс (W.J.Hutchins), в статье которого 'Machine Translation and Machine-aided Translation" (1984) дается анализ истории развития МП в мире.
    Хатчинс отмечает, что хотя предложения о создании программ МП шервые были сделаны почти 60 лет назад одновременно и независимо русским исследователем Смирновым-Троянским и французским Артсоуни, серьезно заниматься данным вопросом стало возможно только с появлением первых компьютеров. Такие исследования стали проводиться в Великобритании с 1946 года, а в 1949 году ход исследований в этой области заметно возрос благодаря публикации меморандума Уорена Вивера от имени Нью-йоркского рокфеллеровского фонда, заявившего, что политические и военные успехи после Второй мировой войны, появление электронных компьютеров и новая информационная теория, разработанная Клодом Шенноном, дают все основания всерьез обратиться в проблемам изучения МП. Первая демонстрация возможностей МП состоялась в 1954 году на основе исследований центра Джорджтаунского университета, которая проводилась для компьютеров типа IBM. Исследовательские работы в области МП финансировались как государственные программы и имели широкую правительственную поддержку. Однако вскоре оптимистические ожидания, связанные с быстрыми и ошеломляющими успехами МП, сменились разочарованием и растущим пониманием необыкновенной сложности решения чисто лингвистических задач - переводы были грубыми и часто нечитабельными, попытки создания программ, способных распознавать знаковые образы и символы экзотических языков, оказались несостоятельными. В 1966г. был создан комитет, который должен был оценить эффективность существующих программ МП, результатом деятельности которого была критическая статьи, надолго затормозившая исследования в области МП в США, т.к. в ней отмечалось, что МП значительно более медленный во времени, менее точный и в два раза более дорогой вид перевода по сравнению с традиционным. Комиссия сдела вывод: "There is no immediate or predictable prospect of useful machine translation". Кроме того, было сказано, что в стране отсутствует потребность в МП вообще, поскольку вполне хватает обычных переводчиков, которые не очень-то и загружены работой. Вместо МП комиссия рекомендова разрабатывать проблемы компьютерной лингвистики, создавая автоматические словари и др. технические средства в помощь традиционным переводчикам. В результате выводов, сделанных комиссией, исследовательские программы в области МП были лишены финансовой поддержки государства и впоследствии закрыты.
    Начиная с 1967 года работы в области МП продолжались, но уже в очень урезанном виде, при полном их игнорировании со стороны лингвистов, специалистов по информатике и др. ученых. В семидесятые годы МП стал демонстрировать значительные успехи - были созданы более сложные экспериментальные программы АП, разработаны системы перевода с участием редактора-переводчика, качество переводов заметно улучшило особенно если перевод осуществлялся на материале определеной терминосистемы.
    В США системы МП в основном ограничивались военно-технической областью и предназначались для очень ограниченного круга потребителей.В Канаде и Европейском союзе ситуация была совершенно отличной. Политика ЕС предусматривала, что все решения, программы в рамках Союза, должны публиковаться на языках стран-участниц договора. Это значительно повысило потребность в услугах переводчиков «привело к необходимости вплотную заниматься разработкой программ МП, который должен были облегчить потребности ЕС.
    Поскольку полный автоматизированный перевод считался отныне недостижимым, усилия исследователей были направлены на то, чтобы: 1) предложить такие переводы, которые, уступая в качестве с точки зрения стиля, могли бы быть "приемлемыми" с информативной (содержательной) стороны и 2) использовать системы лингвистических и терминологических банков в качестве вспомогательных средств для перевода специализированных текстов.
    Все системы МП, по мнению Хатчинса, имеют в своей основе одну из двух возможных стратегий. Первая стратегия предполагает, что программа МП создается для определенной конкретной языковой пары, напр, для русского и английского языков. При этом русский является языком-источником, а английский - языком перевода. Основанный на данной стратегии метод перевода получил название прямого перевода (direct slation). Суть прямого МП состоит в том, что перевод осуществляется непосредственно с русского языка на английский без какого-либо языка-посредника. Слово из русского языка переводится сразу на английский язык, причем весь словарный состав языка-источника в целом и его синтаксис подлежат анализу в минимальной степени. Слово берется только в одном значении, без учета возможных других значений, которые оно может иметь. Если порядок слов языка-источника может быть сохранен в переводе без каких-либо искажений смысла, нет необходимости в его изменении в переводе.
    Вторая стратегия, которая может быть основой МП, предполагает участие человека-посредника в процессе перевода с языка-источника на язык-реципиента. Такой метод перевода принято квалифицировать как непрямой перевод (indirect translation). В качестве языка-посредника используется семантический язык, представляющий структуры языка-источника в виде семантических символов. Напр., если в русском языке могут употребляться различные выражения со значением "large" (большой, огромный, великий, мощный и др.), то в языке-посреднике все они будут соответствовать символу - Magn., который затем уже будет переведен на английский язык с помощью определенного выражения в зависимости от условий лексического окружения всего контекста.
    Прямой метод перевода лежал в основе практически всех программ созданных до 1966-67 годов. Непрямой метод перевода стал преобладать начиная с 1967 г. Соответственно, можно встретить упоминание о программах МП первого и/или второго поколения.
    Какие бы стратегии не лежали в основе МП, любой процесс перевода предполагает анализ текста языка-источника (ИЯ) и синтез текста в языке реципиента или перевода (ПЯ). Анализ предполагает работу со словарем морфологическими и синтаксическими правилами языка, семантическими категориями, синтез сводится к поиску соответствующих переводных эквивалентов в тексте ПЯ. Словари могут быть различными – простой двуязычный словарь (используемый при прямом методе) или одноязычный словарь (в ПЯ и ИЯ). Словари могут содержать только морфологические сведения, или только семантическую информацию, словарь наиболее частотной лексики, словарь неправильных глаголов, словарь идиом и т.д.
    Синтаксический и морфологический анализ единиц текста дополняется также и семантическим анализом, который ограничивается, как правило, разрешением проблем многозначности или двусмысленности после применения первых двух. Напр., в предложении: "The youth hit the child with red hair" семантический анализ позволяет исключить интерпритацию предлога with в значении творительного падежа.
    Следующим этапом анализа может быть анализ прагматической информации текста, в основе которого лежат знания о предметах и явлениях реального мира. Напр., при интерпретации предложения "The police followed the man with binoculars" только знание экстралингвистического копттекста может снять проблему понимания словосочетания with binocular, как дескрипции, относящейся к слову police или к слову the man.
    Операция синтеза, лежащая в основе процесса воспроизведения теста на ПЯ, представляется значительно более простой или может включать несколько этапов — семантический, синтаксический и морфологический синтез. Напр., выбор соответствующего переводного эквивалента для значения слова know на французский язык (savoir или connatre) и др.
    Окончательной стадией МП может служить этап так называемого постредактирования текста, полученного на выходе машиной, в котором принимает участие традиционный или обычный переводчик.
    Оценка качества МП складывается с учетом двух критериев - легкость чтения и понимание перевода и верность передаваемой им информации. Онако эти факторы могут не всегда совпадать. Перевод может быть легко читаемым и понятным, но не верным, и наоборот, - точным, но громоздким и трудно воспринимаемым. В отношении текстов научной, технической или деловой документации на первое место выступает критерий верности и точности передаваемого содержания. С другой стороны, некоторые стилистические неточности и шероховатости могут быть вполне допустимыми, при условии, что содержание текста не претерпело существенных смысловых искажений.
    Системы МП первого поколения основываются на так называемом (word- for-Word) пословном переводе. Каждому слову в тексте ИЯ находится сответствие в двуязычном словаре ПЯ, при этом допускаются минимальные в структуре предложения. Типичным примером такого перевода может служить программа MARK II для перевода с русского на английский язык, разработанная в 1964 году и используемая в авиации США Н 1970 г. Как правило, переводы, полученные в результате использования этой программы, были очень грубыми и даже после постредактирования малопригодными. Проверка качества перевода, предпринятая на материале 200 страниц текста, показала, что 7573 случая представляли собой смыловые ошибки, среди которых - 53% составляли пропущенные и непереведенные слова, 26% - неправильный перевод слов, 12% - неверный выбор соответствия, 13% - неверный словопорядок.
    В течение ряда лет самым известным центром по созданию программ МП была группа Джорджтаунского университета в США, которая разработала систему русско-английского перевода для комиссии по атомной энергетике (EURATOM), принятой впоследствии и европейскими институтами преобразованной в дальнейшем в программу SYSTRAN (1976). В основе данной системы МП лежал эмпирический подход: программа была рассчитана на перевод узкоспециальных текстов, затем апробирована на большем корпусе текстового материала, усовершенствована, еще раз проверена «а более широком корпусе, снова усовершенствована и т.д. В результате эта система МП имела очень сложную грамматику без четкого подразделения между этапами анализа и синтеза, синтаксический анализ был представлен на элементарном уровне. Согласно опросу, проведенному среди пользователей данной программы, выяснилось, что в основном качество перевода было удовлетворительным для 96% пользователей. Программа SYSTRAN была взята на вооружение в NASA (1970) и использовалась при осуществлении известного проекта Союз-Аполлон в 1976 году.
    По сравнению с предшествующей программой Mark-2 SYSTRAN представляла собой более усовершенствованную версию МП с элементами анализа и синтеза. Словарная стадия анализа опиралась на использованн двух словарей. Сначала русское слово проверялось по словарю наиболее частотной лексики и устойчивых выражений, затем в алфавитном порядке по словарю корневых основ. Далее устанавливалась грамматическая функция падежных или глагольных окончаний и подбирался эквивалент английском языке.
    Сравнение переводов одного и того же текста, выполненного программами Mark-II и SYSTRAN, показало, что на самом деле SYSTRAN обеспечивает не на много более высокое качество перевода. Так, Mark-11 дает 1,2% непереведенных слов, a SYSTRAN - 2,3%, альтернативные варианты перевода у Mark-II - 6,3%, у SYSTRAN - 5,3%. Вывод, который был сделан экспертом - при разработке системы МП наблюдается слабый прогресс.
    Другой наиболее известной программой МП, наряду с SYSTRAN, была программа LOGOS, предназначенная для перевода с английского языка на вьетнамский- Программа предусматривала операции анализа и синтеза бе предварительного редактирования текста. Границы между словал
    126
    устанавливались автоматически, текст членился на предложения, выделялись нводные конструкции (парентезы). При этом в ходе трансформации с английского языка на вьетнамский английская атрибутивная группа типа Adj + N трансформировалась в характерную для вьетнамского языка - N+Adj; английская пассивная конструкция подлежала замене на активную (т.к. во вьетнамском нет пассивного залога), сложные номинативные обороты типа Wires can be disconnected by removal of clip упрощались в синтаксические структуры типа You can disconnect wires when you have removed clip. Разработчики программы признавали, что данная программа тем не менее нуждается в постредактировании, т.к. в ряде случаев необходимо обращение к более глубокому семантическому анализу и опора на прагматический
    контекст.
    Оценивая в целом программы МП первого поколения, в основе которых был "прямой" метод перевода, Хатчинс отмечает, что все они были эмпирическими и отличались слабой теоретической разработкой лингвистических аспектов перевода. Главный недостаток заключался, как правило, в полном игнорировании семантического анализа и контекста.
    Системы МП второго поколения.
    В основе МП второго поколения лежит идея использования языка-посредника, так называемого "interlingua", универсального семантического языка, с которого осуществляется трансляция на ПЯ. Таким образом, процесс перевода предполагает три стадии: 1) анализ ИЯ, 2) трансформационный компонент (Transfer), 3) синтез в ПЯ. Данный подход базируется на использовании трех типов словарей: одноязычный словарь ИЯ, содержащий толкования морфологии, синтаксиса и семантики языковых единиц, двуязычный словарь переводных соответствий и одноязычный словарь ПЯ. В отличие от программ МП первого поколения, критерием разработки которых был эмпирический метод "проб” и ошибок", программы "непрямого" перевода основывались на глубоком анализе собственно лингвистических закономерностей языков и строгих вычислительных процедурах.
    Примером программы МП второго поколения может служить система разработанная в Техасском университете для перевода с немецкого языка на английский - METALS, которая в дальнейшем применялась и для других языковых пар. В основу системы были положены принципы трансформационной (порождающей) грамматики Н.Хомского, включающей уровни поверхностных грамматических структур языка и глубинн составляющих. Трансформационные правила позволяли осуществлять переход с уровня глубинной языковой структуры (содержащей смысловой компонент) на уровень поверхностных языковых форм. Таким образом, глубинные структуры выполняли роль "interlingua", языка-посредник; с помощью которого был возможен МП. "Стандартная" глубинная грамматика была пригодна для любого языка, описание параметров которого задавалось в терминах предиката и его аргументов.
    Недостатком техасской программы МП было то, что в ее основе тоже лежал принцип игнорирования контекстуально обусловленных значений плюс многоступенчатость и громоздкость синтаксического анализа.
    Позднее разными группами ученых предлагались более усложненные многоступенчатые модели МП, в которых были предприняты попытки ввести семантико-прагматическую составляющую на стадии анализа и синтеза с тем, чтобы повысить уровень и качество перевода. Однако работа в этом направлении еще не закончена и по сей день.
    К восьмидесятым годам сложилось мнение, что идеальный осуществляемый автоматически без участия человека, - утопическая, невыполнимая задача. Усилия исследователей были направлены на создание так называемых интерактивных систем перевода, т.е. таких, которые представляют собой компьютерные программы, предназначенные для того, чтобы облегчить работу традиционного переводчика: автоматические базы данных, терминологические глоссарии, словари и т.д. Участие человека в этом могло включать такие стадии, как: предварительное редактирование текста ИЯ, его упрощение, снятие проблем многозначности, выбор переводного соответствия из нескольких вариантов и др.
    Примером интерактивной системы МП может быть программа MIND, созданная под эгидой Rand Corporation (США). Данная система имеет морфологический и синтаксический анализаторы, корпус базовых семантических компонентов, трансформационный компонент, морфологический синтезатор. Для разрешения проблем многозначности или двусмысленности предполагается участие человеческого переводчика. Так, для перевода предложения "They filled the tank with gas" переводчику-консультанту машина может задать следующие вопросы:

    Does the word 'tank' refer to
    1. A military vehicle?
    2. A vessel for fluids?
    Does 'they' refer to
    1. Soldiers? , ., ,,, .
    2. Tanks?
    3. Shell?
    Does 'gas' refer to
    1. Gasoline?
    2. Vapor?

    Тем не менее MIND все еще остается экспериментальной лабораторной разработкой, не получившей широкого применения.
    В заключение своего обзора Хатчинс делает вывод о том, что несмотря на многочисленные объективные трудности и нерешенные проблемы, связанные в целом с задачей программирования систем искусственного интеллекта, исследовательские работы по усовершенствованию теории МП набирают ход и внушают определенный оптимизм.
    В последние два десятилетия 20 века на фоне стремительного развития вычислительной техники и компьютерных систем значительно вырос интерес к теории МП, благодаря чему появились новые многочисленные и разнообразные программы МП. Тем не менее, по большому счету, как считает Хатчинс, они не привели к существенному улучшению качества перевода, по сравнению с программами 70-х годов. То, что действительно
    повлияло на модернизацию и оптимизацию качества МП - это включение МП в мировую информационную сеть - Интернет. Новый импульс в процессе развития МП связан прежде всего с эпохой Интернета.
    Система Интернета существенно демократизировала и облегчила доступ к МП. Пользователи ПК во всем мире испытывают растущий интерес и потребность в получении информации через Интернет, представленной на различных иностранных языках. Как следствие, значительно возрос интерес к переводу, причем к переводу в режиме on-line, от которого во многом зависит коммерческий успех многих компаний. Не случайно, по данным Economist,16.03.02, только в 1999 году 33 ведущие американские компании создали свои web-сайты, снабженные on-line переводом на разные языки, и еще 57 - в 2000 году.
    Сегодня одной из лучших систем МП, работающей в on-line режиме признана программа Babel Fish, созданная на основе SYSTRAN используемая поисковой программой Alta Vista. Потребность в синхронном АП растет с каждым днем наряду с ростом числа пользователей Интерна Так, если к концу 2000 года около 48% пользователей было англоговорящими, то к концу 2002 года их число сократилось до 32%.
    Программы МП дают наиболее оптимальные результаты, если они разработаны для перевода текстов определенных узкоспециальных областей таких, как микробиология, космонавтика, молекулярная физика и т.д. Он основываются на анализе типичной терминологической лексики и некотором количестве общеязыковых терминов. При этом они рассчитаны на тексты написанные стилистически точным и правильным языком. Использование МП в целях перевода Интернет-страниц, чатов, электоронной почты, стиль которых характеризуется элементами слэнга и разговорного языка, вызываны значительные трудности для МП, качество которого существенно страдает.
    Тем не менее Интернет изменил отношение пользователей к качеству перевода, предоставляемого МП. Окруженные морем непрерывно растущей информации потребители предпочитают сегодня скорость, т.е. более
    быстрый, хотя и грубый (или приблизительный) перевод, по сравнению с его
    качеством.
    Подключение Интернета к МП позволяет облегчить создание стандартизованных машинных переводов различных документов, материалов и текстов, которые, как правило, изначально создаются на английском языке, соблюдая некоторые нормы стандартизованного стиля, благодаря чему их перевод на другие языки не представляет особых проблем.
    Другим фактором повышения качества МП и его эффективности является использование так называемой translation memories - корпуса памяти перевода. Память перевода представляет собой корпус текстов и предложений аналогичной тематики, которые уже когда-либо переводились. Для того, чтобы перевести то или иное предложение, достаточно обратиться k корпусу памяти, в которой может иметься подобное предложение на
    различных языках.
    Несомненно, Интернет оказал решающее влияние на эффективность и дальнейшую оптимизацию МП, который стал сегодня неотъемлемой составляющей информационных технологий. Что же касается качества самого перевода, то одновременно с усилиями исследователей, направленными на его непрерывное совершенствование, не следует забывать, что порой и обычные, традиционные переводчики допускают досадные ошибки как с точки зрения точности перевода терминов, так и с точки зрения стилистических и иных культурологических норм, связанных с комплексом проблем межкультурной коммуникации в целом. Однако главные преимущества МП, объединенного с Интернетом, - это скорость, свобода доступа и всеобъемлемость перевода, без которого технический прогресс уже представляется невозможным.
    Категория: Все для экзамена | Добавил: pressa (04.08.2012)
    Просмотров: 2476 | Рейтинг: 0.0/0 |
    Дополнительный материал для Вас от сайта englishschool12.ru

    Гольцова Е.В. Английский язык для пользо...
    FUNNY RHYMES
    Семинар для учителей английского

    Боремся с тошнотой. 
    My breakfast. 
    История и формирование английского языка... 

    Английский язык для школьников №5
    Готовые домашние задания по немецкому яз...
    Английский язык для школьников №15

    ОСОБЕННОСТИ ПОДЧИНЕНИЯ ОПРЕДЕЛИТЕЛЬНЫХ ... 
    J.M.Barrie, The Adventures of Peter Pen 
    Галь, Нора Слово живое и мертвое: от &qu... 

    Всего комментариев: 0
    Добавлять комментарии могут только зарегистрированные пользователи.
    [ Регистрация | Вход ]
    Welcome
    Меню сайта
    Info
    Видео
    englishschool12.ru
    Info

    Сайт создан для образовательных целей
    АНГЛИЙСКАЯ ШКОЛА © 2018
    support@englishschool12.ru

    +12
    Все права защищены
    Копирование материалов возможно только при разрешении администратора сайта