Алгоритмы машинного перевода
ДАЙДЖЕСТ РУССКОЙ ИНТЕРНЕТ
Алгоритмы машинного перевода
На земле существует множество народов и, соответственно, великое многообразие языков. До появления международной торговли и особенно Интернет, на это как-то не обращали внимания. Вполне хватало обычных переводчиков. Однако теперь, когда каждый кооператив в состоянии без особого труда наладить международные торговые связи, одних только обычных переводчиков стало явно не хватать и активизировались попытки создать автоматизированные программы перевода.
Преимущества автоматизации в данной области очевидны, ибо даже самый профессиональный переводчик не в состоянии тягаться с персональным компьютером, если считать с момента получения электронного документа на одном языке (например, через электронной почту) и до момента его получения на другом языке, также в электронном виде.
Однако в данной области существует ряд крайне сложных проблем, разрешение которых лежит прежде всего в области методологии языка и алгоритмики разложения лингвистических конструкций на элементарные однозначные элементы, которые было бы можно уже перевести в аналогичные элементы другого языка. Первые теоретические работы в данной области были начаты еще Лейбницем и Декатром, но успеха они не имели. Позднее предпринимались попытки создать некий искусственный промежуточный язык символов, понятный для людей разных национальностей. Определенных успехов добился Джон Вилкинс с языком "interlingua" и Лев Знаменгоф с языком "эсперанто". Однако даже эти эксперименты не смогли продвинуть методологию на уровень, достаточный для создании машинных алгоритмов автоматического перевода.
Основной проблемой, над которой бьются специалисты всего мира, является адекватность полученного перевода. В связи с большими различиями в алфавитах и принципах построения фраз, одна и та же мысль на разных языках формулируется абсолютно иначе. Так, например, в английском языке не существует понятия "вы", как уважительного обращения к собеседнику. Поэтому в русском языке существует принципиальное различие между "вы" и "ты", а в английском - нет. Существующие сейчас программные переводчики по большей части пригодны лишь для технического перевода, где самую важную роль играет точное сохранение всех технических терминов и аббревиатур. Они больше похожи на быстродействующие объемные двуязычные словари, способные распознать в тексте отдельные слова и точно привести их значение. При этом, если значений несколько, они указывают их все. С точки зрения технического руководства это может быть и преемлимо, но в области деловой переписки и тем более контрактов совершенно не годится. В этих случаях первостепенное значение имеет прежде всего смысл содержимого, а не точное значение каждого конкретного слова.
Чрезвычайно интересно о современном состоянии развития методологии перевода различных языков и о перспективах создания действительно эффективных программ машинного перевода, пригодных для широкого делового применения, рассказывается в статье Кирила Широкова "UNL - Universal Networking Language" (inter.net.ru:8080). В ней рассказывается о работах по созданию универсально машинного языка, позволяющего не переводить фразу на одном языке на фразу на другом, а представлять высказанную мысль в специальных конечных терминах промежуточного машинного языка. Это позволит переводить не сами слова, а заложенный в них смысл без неизбежных пока в данной области смысловых ошибок.
Александр Запольскис
E-mail: leshy@nestor.minsk.by - титульная страница
Алгоритмы машинного перевода
На земле существует множество народов и, соответственно, великое многообразие языков. До появления международной торговли и особенно Интернет, на это как-то не обращали внимания. Вполне хватало обычных переводчиков. Однако теперь, когда каждый кооператив в состоянии без особого труда наладить международные торговые связи, одних только обычных переводчиков стало явно не хватать и активизировались попытки создать автоматизированные программы перевода.
Преимущества автоматизации в данной области очевидны, ибо даже самый профессиональный переводчик не в состоянии тягаться с персональным компьютером, если считать с момента получения электронного документа на одном языке (например, через электронной почту) и до момента его получения на другом языке, также в электронном виде.
Однако в данной области существует ряд крайне сложных проблем, разрешение которых лежит прежде всего в области методологии языка и алгоритмики разложения лингвистических конструкций на элементарные однозначные элементы, которые было бы можно уже перевести в аналогичные элементы другого языка. Первые теоретические работы в данной области были начаты еще Лейбницем и Декатром, но успеха они не имели. Позднее предпринимались попытки создать некий искусственный промежуточный язык символов, понятный для людей разных национальностей. Определенных успехов добился Джон Вилкинс с языком "interlingua" и Лев Знаменгоф с языком "эсперанто". Однако даже эти эксперименты не смогли продвинуть методологию на уровень, достаточный для создании машинных алгоритмов автоматического перевода.
Основной проблемой, над которой бьются специалисты всего мира, является адекватность полученного перевода. В связи с большими различиями в алфавитах и принципах построения фраз, одна и та же мысль на разных языках формулируется абсолютно иначе. Так, например, в английском языке не существует понятия "вы", как уважительного обращения к собеседнику. Поэтому в русском языке существует принципиальное различие между "вы" и "ты", а в английском - нет. Существующие сейчас программные переводчики по большей части пригодны лишь для технического перевода, где самую важную роль играет точное сохранение всех технических терминов и аббревиатур. Они больше похожи на быстродействующие объемные двуязычные словари, способные распознать в тексте отдельные слова и точно привести их значение. При этом, если значений несколько, они указывают их все. С точки зрения технического руководства это может быть и преемлимо, но в области деловой переписки и тем более контрактов совершенно не годится. В этих случаях первостепенное значение имеет прежде всего смысл содержимого, а не точное значение каждого конкретного слова.
Чрезвычайно интересно о современном состоянии развития методологии перевода различных языков и о перспективах создания действительно эффективных программ машинного перевода, пригодных для широкого делового применения, рассказывается в статье Кирила Широкова "UNL - Universal Networking Language" (inter.net.ru:8080). В ней рассказывается о работах по созданию универсально машинного языка, позволяющего не переводить фразу на одном языке на фразу на другом, а представлять высказанную мысль в специальных конечных терминах промежуточного машинного языка. Это позволит переводить не сами слова, а заложенный в них смысл без неизбежных пока в данной области смысловых ошибок.
Александр Запольскис
E-mail: leshy@nestor.minsk.by - титульная страница
Компьютерная газета. Статья была опубликована в номере 20 за 1998 год в рубрике del :: даиджест интернет