Анализ и оценка эффективности современных систем машинного перевода

  • Автор:
  • Специальность ВАК РФ: 10.02.21
  • Научная степень: Кандидатская
  • Год защиты: 2000
  • Место защиты: Москва
  • Количество страниц: 265 с.
  • бесплатно скачать автореферат
  • Стоимость: 230 руб.
Титульный лист Анализ и оценка эффективности современных систем машинного перевода
Оглавление Анализ и оценка эффективности современных систем машинного перевода
Содержание Анализ и оценка эффективности современных систем машинного перевода
Содержание
Введение
Глава 1 Современное состояние разработки систем машинного перевода
1.1 Роль и место СМП среди других лингвистических процессоров
1.2 Типология современных систем МП
1.3 Системы прямого перевода
1.4 Трансферные СМП
1.5 СМП семантического типа
1.6 Выводы к главе
Глава 2 Современная методология оценки эффективности систем машинного перевода
2.1 Современные методы оценки СМП
2.2 Типология ошибок при работе МП
2.3 Выводы к главе
Глава 3 Оценка эффективности основных действующих систем машинного перевода
3.1 Краткая характеристика систем МП: PROMT 98, Systran Pro 2.0, СПРИНТ-5, Сократ 2.0, Langenscheidt T1 Standard 3.0, Personal Translator Plus 2.0, Power Translator Deluxe
3.2 Оценка эффективности современных СМП: PROMT 98, Systran Pro
2.0, СПРИНТ-5, Сократ 2.0, Langenscheidt T1 Standard 3.0, Personal Translator Plus 2.0, Power Translator Deluxe
3.3 Выводы к главе
Заключение
Библиография Приложение

Введение
Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. На работе и дома мы пользуемся современными средствами связи; компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в обыденной жизни. Бурное развитие новых информационных технологий свидетельствует о всевозрастающей роли вычислительной техники в мировом информационном пространстве, о постепенной дигитализации все новых и новых отраслей нашей жизни. С каждым годом увеличивается число пользователей Интернета — Всемирной паутины, которая претендует на роль единого информационного пространства в планетарном масштабе. Несмотря на противоречивость нашего мира, наличие вооруженных конфликтов и разногласий между странами, Сеть становится "виртуальной реальностью" особого типа, позволяющей осуществлять такую интеграцию между народами, которая в реальной жизни остается все еще несбыточной мечтой. Сеть Интернет - это мир без границ, где в течение нескольких секунд можно оказаться на другой части земного шара. Единственной преградой, которая незримо присутствует во всей Сети, является языковой барьер. Эта проблема, общая как для реального, так и для "виртуального" мира сети Интернет, до настоящего момента так и не нашла своего кардинального решения. Попытки внедрения универсального языка типа Эсперанто или какого-либо другого языка не привели к их массовому использованию, и единственным способом преодоления языкового несоответствия является перевод, известный еще с древнейших времен, когда этим делом занимались толмачи.
Но нынешний век, где информация изменяется 24 часа в сутки и применяются электронные средства связи, диктует свои условия. В такой ситуации

классический подход к осуществлению перевода не всегда оправдывает себя, т.к. требует больших капиталовложений и временных затрат. По сравнению с прошлыми веками объем информации, предназначенной для перевода, значительно увеличился. В некоторых случаях более целесообразным представляется использование машинного или автоматического перевода и систем машинного перевода (СМП). Развитие таких систем позволит оперативно осуществлять перевод информации и обрабатывать большие массивы документов в предельно сжатые сроки, т.е. удовлетворять основному требованию сегодняшней жизни: оперативной обработке огромных массивов информации при минимальных затратах.
Выбор данной темы исследования обусловлен в первую очередь ее новизной, недостаточной степенью исследованности и актуальностью рассматриваемых задач. Проблема эффективности машинного перевода является одним из ключевых факторов, определяющих перспективность развития данной области науки. В настоящее время не существует единой системы оценки эффективности работы существующих СМП. В данной работе предпринимается попытка проведения сравнительного анализа эффективности современных коммерческих СМП. В исследовании участвовали системы, осуществляющие перевод с русского языка на английский и обратно, и системы перевода с английского языка на немецкий и обратно. Для определения степени влияния языковой интерференции на качество перевода в эксперимент были включены англонемецкая и немецко-английская языковые пары.
Целью настоящей работы является сопоставительное исследование эффективности современных СМП. В основу качественного показателя результатов перевода и эффективности систем были положены не только лингвистические, но и экстралингвистические критерии оценки СМП.

— TRANSLATOR - система перевода с японского языка на английский и обратно Колгейтского университета (США) (Боброва, 1990, ИИ-90, 1990, Капанадзе, 1989, Королев, 1991, Кулагина, 1990, Hutchins 1986, Lawson, 1991, Levitt, 1993, Maxwell et al, 1988, Piggot, 1989, Tucker et al., 1984).
В университетах Билкент (Турция) и Карнеги Меллон (США) ведутся исследовательские работы по созданию СМП, основанной на использовании баз знаний, для перевода с турецкого языка на английский. В системе используется язык-посредник. Прототипом данной СМП стала система, основанная на знаниях KANT (Hakkani et al, 1983, 1998, Levitt, 1993, Nyberg et al., 1992, 1994). К сожалению, и эта система по-прежнему является прототипом и трудно судить о качестве и результатах ее перевода.
Таким образом, говорить о серьезном применении СМП семантического типа несколько преждевременно. Данное направление, возможно, получит свое широкое распространение лишь после прорыва в области создания систем ИИ, когда станут возможными формализация и представление в системе экстралин-гвистических знаний.

Рекомендуемые диссертации данного раздела