Руководство пользователя ОмегаТ 3.0

Машинный перевод

Введение

В отличие от систем, использующих память перевода, которую создают пользователи (как в случае ОмегаТ), системы машинного перевода основаны на наборах лингвистических правил. Для построения модели перевода используются статистические технологии обучения, основанные на исходных и переведённых текстах. В результате некоторых исследовательских работ, качество работы сервисов машинного перевода неуклонно повышается.

Чтобы использовать какой-либо из сервисов машинного перевода, в меню «Параметры» > «Машинный перевод» установите флажок напротив названия нужного сервиса. Заметьте, что для использования этих сервисов требуется подключение к Интернету.

Google Translate

Google Translate — это платный сервис от Google, для перевода предложений, веб-сайтов и целых текстов между всё увеличивающимся набором языков. На момент написания этого руководства список включал более 50 языков, от албанского до идиш, и в том числе, конечно, все основные мировые языки. Стоимость услуги зависит от объёма переводимых текстов, на момент написания документации, 20 долларов США за миллион символов.

Внимание! прежде чем начать использовать сервис Google Translate, в вашей учётной записи необходимо указать номер счёта (для получения более подробной информации, посетите страницу Pricing and Terms of Service). Чтобы идентифицировать себя как пользователя сервисов Google, надо воспользоваться уникальным персональным ключом, выданным вам Google при регистрации. Подробную информацию о том, как передать ключ ОмегаТ, можно найти в разделе Установка и запуск, подраздел «Аргументы команды запуска».

Конечно, качество перевода зависит, с одной стороны, от набора текстов на языке перевода и доступности их двуязычных версий, а с другой стороны — от качества сконструированных моделей. Очевидно, что хотя в некоторых случаях такого качества будет недостаточно, со временем оно будет только улучшаться.

Пользователи ОмегаТ и Google Translate

Пользователи ОмегаТ не обязаны использовать Google Translate. Даже если вы решите воспользоваться этим сервисом, информация о том, воспользовался ли пользователь предложенным вариантом перевода и каков окончательный перевод сегмента, в Google отсылаться не будет. На иллюстрации ниже показаны: оригинал на английском языке, перевод на испанский язык и машинный перевод на словенский язык, выполненный Google Translate.

Рисунок 19. Google Translate - пример
Google Translate - пример

Испанский перевод лучше, чем словенский. Обратите внимание на слова interesar и navegar в испанском тексте, которые являются корректными переводами глаголов «interest» и «sail». В словенской версии оба слова были переведены существительными. Вполне возможно, что испанский перевод хотя бы частично основан на переводе схожего предложения другим человеком.

После того, как вы подключили сервис, при каждом переходе к новому сегменту в области машинного перевода будут появляться соответствующие подсказки/варианты перевода. Если предложенный перевод кажется вам удачным, нажмите CTRL + M , и он будет вставлен в поле редактирования перевода текущего сегмента. Например, в сегменте, приведённом на иллюстрации выше, при нажатии CTRL + M испанский перевод будет заменён на словенский.

Если вы не хотите, чтобы ОмегаТ отсылала в Google переводимые вами сегменты, в меню «Параметры» снимите флажок «Google Translate».

Заметьте, что в сервисы машинного перевода посылаются только исходные сегменты! Онлайн версия Google Translate позволяет пользователю править перевод и отсылать в Google скорректированный вариант. Однако в ОмегаТ подобная возможность не реализована.

Belazar

Belazar — система машинного перевода для языковой пары русский-белорусский.

Apertium

Apertium — это свободная платформа машинного перевода, изначально разрабатывавшаяся для перевода между родственными языками, такими как каталонский, испанский, галисийский, португальский, окситанский и французский, однако недавно её возможности были расширены для охвата более различающихся языковых пар (например, языковой пары английский - каталонский). Список доступных для перевода языковых пар можно найти на веб-сайте Apertium.

Платформа предоставляет следующее:

  • ядро системы машинного перевода, независящей от языковой пары;

  • инструменты для управления лингвистическими данными для построения системы машинного перевода;

  • лингвистические данные для всё расширяющегося списка языковых пар.

Ядро Apertium использует конечные преобразователи для последовательной обработки исходного текста: сначала убирается форматирование, затем происходит морфологический анализ, выделение частей речи, структурное преобразование, лексическое преобразование, морфологическое преобразование и, наконец, восстанавливается форматирование.

На базе Apertium можно создать систему машинного перевода для многих языковых пар, в Apertium используются простые XML-файлы с нужными лингвистическими данными, которые затем преобразовываются специальными утилитами в формат, пригодный для быстрой обработки ядром.

Машинный перевод - решение проблем

Если в области машинного перевода не показывается ничего, проверьте:

  • Подключены ли вы к Интернету? Чтобы использовать Google Translate, необходимо подключение к Интернету.

  • С какого и на какой язык осуществляется перевод? Убедитесь, что сервис машинного перевода поддерживает эту языковую пару.

  • Google Translate не работает: подключили ли вы Translate API? Заметьте, что сервис Google Translate не бесплатен, более подробную информацию можно найти в разделе Установка и запуск ОмегаТ (аргументы команды запуска).

  • «Google Translate returned HTTP response code: 403 ...»: убедитесь, что в pinfo.list введён правильный ключ, длиной 38 символов. Убедитесь, что задан API-ключ.

  • Google Translate не работает, хотя задан правильный API ключ. Убедитесь что в меню Параметры > Машинный перевод, установлен флажок Google Translate V2.

  • Google Translate v2 отвечает «Bad request» - проверьте языки исходных и переведённых файлов проекта. Подобный ответ возникает, если языки не установлены.