Полисемия в контексте нейронного машинного перевода

Ермолаева, Анна Александровна

В данной статье речь пойдет об одной из основополагающих лингвистических проблем нейронного машинного перевода, а именно такой, как полисемия или иначе говоря, многозначность, которая остается актуальной и на сегодняшний день.

Ключевые слова : полисемия, машинный перевод, исходный текст, исходный язык, толковый словарь, служебная программа, слово, искусственный интеллект.

На сегодняшний день перевод обретает все большую востребованность. С развитием международных отношений все большее количество специалистов из разных областей знаний сталкиваются с необходимостью прибегнуть к переводу текста с одного языка на другой. Как правило, в большинстве случаев им на помощь приходят небезызвестные интеллектуальные системы перевода. Но, стоит признать, что несмотря на значительные успехи в разработках в области искусственного интеллекта, машинный перевод, к сожалению, все еще остается несовершенным. Главной проблемой здесь выступает присущая естественным языкам многозначность или, иначе говоря, полисемия. Как, например, при определении такой единицы языка, как «уж». В данном случае речь идет о ряде неядовитых змей или имеется в виду «уж замуж невтерпеж»?

Так что же такое полисемия? Полисемия (от греческого слова «polysemos» — многозначный) обозначает наличие у единицы языка более одного значения — как правило, двух или нескольких. Часто, когда речь заходит о полисемии, подразумевают многозначность слов как единиц лексики. Лексическая полисемия, в свою очередь, представляет собой способность одного слова выступать для наименования разных предметов или явлений действительности.

В целом, проблема лексической многозначности выступает на сегодняшний день одной из самых трудоемких прикладных задач, связанных с лексическим значением. Задача автоматического или реже полуавтоматического разрешения проблемы лексической многозначности впервые была сформулирована в рамках направления науки и технологии, связанного с созданием систем машинного перевода.

Как правило, в любом языке, реализацию того или значения слова осуществляет контекст или ситуация. В естественной речи люди всегда интерпретируют высказывания исходя из понимания определенного контекста. Также, например, из вырванного из контекста предложения «I arrived at the bank» невозможно понять, прибыл говорящий в финансовое учреждение или на берег реки.

Абсолютно также, как контекст обусловливает конкретное значение какого-либо многозначного слова, также, при определенных условиях он может формировать так называемую, семантическую диффузность, что представляет собой совместимость отдельных лексических значений, то есть ситуацию, когда их разграничение не осуществляется (как и не представляется необходимым). Некоторые значения проявляют себя только в сочетании с определяющим словом; а в некоторых же сочетаниях значение многозначного слова представляется как фразеологически связанное. Различные значения слов характеризуются не только лексической сочетаемостью и словообразовательными особенностями, но также в ряде случаев и особенностями грамматической сочетаемости.

Проблема многозначности может считаться решенной, если для слова выбрано его постоянное значение или если найден синонимический эквивалент в виде постоянного значения для метафорического использования.

Установлено, что при разрешении многозначности имеет место ряд самостоятельных задач. Среди них, хотелось бы выделить наиболее крупные, «классические» задачи:

1) Задача присвоения известного значения известной лексеме.

2) Задача присвоения известного значения новой лексеме.

3) Задача проявления нового значения для известной лексемы.

4) Задача проявления нового значения для новой лексемы.

Если установлено, что должно быть представлено на входе (слово) и что на выходе (значение) системы разрешения многозначности, то построение системы сводится к созданию и заполнению словарей слов и значений, а также к построению механизмов разрешения многозначности.

Для новых слов, включая имена собственные, важно сначала вывести перечень возможных значений, а уже потом перейти к решению классической задачи разрешения многозначности.

На сегодняшний день различают два основных класса механизмов разрешения проблем многозначности. Первый класс представляют собой автоматические механизмы, рассчитанные полностью на компьютерное решение поставленной задачи. Второй класс представлен интерактивными (диалоговыми, полуавтоматическими) механизмами, рассчитанными на совместное решение задачи человеком и компьютером, и сводящимися к тому, что компьютер предоставляет человеку набор альтернатив, из которого он должен выбрать один вариант.

Одним из автоматических подходов в разрешении проблемы многозначности являются фильтры, то есть методы, которые не выявляют точного значения, но накладывают видимые ограничения на их спектр. Примерами фильтров такого характера могут выступать правила сочетаемости лексем, правила входимости актантов в синтаксемы и предикативные структуры.

К механизмам разрешения проблемы многозначности относятся также и те механизмы, которые не характеризуются использованием лексического значения, постулированного в явном виде, как это можно свидетельствовать, например, в толковом словаре. Такие методы, как правило, носят статистический характер.

Для осуществления перевода многозначных слов также применяются контекстологические словари, словарные статьи которых являют собой алгоритмы запроса к контексту на наличие или отсутствие контекстных определителей значения. Для каждого многозначного слова указывается приоритетный ему переводной эквивалент, специфичный для рассматриваемой предметной области. В настоящий момент нет необходимости соединять воедино контекстологический словарь и наборы контекстов со специальной алгоритмической процедурой, так как современные языки программирования предоставляют возможность многообразной реализации системы словаря на компьютере в соответствии с общими условиями его функционирования.

При интерактивном подходе автор (редактор) текста образует с помощью опорного толкового словаря родного языка смысловые дополнения, а переводы слов, словосочетаний с учетом дополнений проводятся с помощью специализированных словарей исходного и целевых языков, согласованных со словарем.

В опорном толковом словаре исходного языка соединяются функции толкового и переводного словаря. Этот словарь отображает элементы исходного языка, имеющие особое значение при переводе хотя бы на один из целевых языков, входящих в систему согласованных (переводных) словарей данного исходного языка. Значения представляются в виде отдельной секции, следующей вслед за интерпретациями тех смысловых значений слова, для которой они являются общими. Это допускает в процессе кодирования многообразие не только лексических, но также и грамматических значений.

Процесс смыслового кодирования исходного текста осуществляется в компьютере автора исходного текста с использованием служебной программы, включающей в себя упомянутый опорный толковый словарь исходного языка и реализующей в соответствии с указаниями автора операции, направленные на образование смысловых дополнений. В процессе кодирования автор последовательно производит анализ, слово за словом, исходный текст и выделяет очередное слово особым шрифтом в том случае, если, по мнению автора (или же в некоторых случаях — по инициативе служебной программы), данное слово характеризуется хотя бы одним из следующих признаков:

a) данное слово является многозначным;

b) грамматическая структура данного слова и связанных с ним слов не отображает тот или иной оттенок фактического смысла текста, хотя в переводе на целевой язык данное слово и (или) связанные с ним слова могут иметь конкретные грамматические структуры, выбор которых строго зависит от контекста;

c) если имеют место глаголы, деепричастия, причастия, чья форма в исходном языке не отображает наиболее явно тот или иной характер описываемого в тексте действия и (или) состояния, достигнутого в результате действия, в то время как в том или ином целевом языке для объяснения указанных оттенков действий и (или) состояний применяются, в соответствии с фактическим смыслом текста, глаголы, деепричастия, причастия, которые имеют конкретные грамматические структуры;

d) данное слово совместно с некоторыми словами-соседями являет собой словосочетание, для осуществления перевода которого может понадобиться поиск среди известных словосочетаний, которые относятся к данному слову, причем в некоторых отдельных случаях возможны различия в лексическом составе или в структуре, которые не оказывают влияния на иносказательное значение словосочетания.

Затем служебная программа вынимает из опорного толкового словаря словарную статью, которая соответствует отмеченному автором слову. А далее уже автор приводит пояснение смысла этого слова, проводя сопоставление исходного текста с теми или иными элементами статьи.

Служебная программа также обладает рядом некоторых инициативных функций, благодаря которым она может указывать автору на несовпадение употребления слова или словосочетания в исходном тексте и в отмеченном элементе словарной статьи, а также она может указывать автору на те слова, которые были пропущены в ходе анализа исходного текста, но, вероятно, обладающие той или ной многозначностью.

Слушателю для понимания целостной ситуации всегда будет нужен контекст. И проблема здесь состоит, к сожалению в том, что машинный перевод не учитывает важность контекста и поэтому априори предрасположен к ошибкам при генерации целевого предложения. Из этого следует, что мечта об универсальном переводчике, благодаря которому возможно было бы преодолеть вавилонское смешение языков, пока не стала реальностью.

Литература:

Зубов А. В., Зубова И. И. Основы искусственного интеллекта для лингвистов. — М.: Грант, 2007. 243 с.
Марчук Ю. Н. Основы компьютерной лингвистики. — М.: АСТ: Восток-Запад, 2007. 317 с.
Марчук Ю. Н. Проблемы машинного перевода. — М.: Наука, 1983. 233 с.

Полисемия в контексте нейронного машинного перевода

Библиографическое описание:

Ключевые слова

Похожие статьи

Похожие статьи

Ответим на ваш вопрос!