Внимание!
Это материал, посвященный исследованию онлайн-переводчиков за 2017 год. То каким были онлайн переводчики всего 5 лет назад.
Десять лет назад над машинными переводами все смеялись. Базы данных были небольшими, а алгоритмы распознавания контекста – слабыми. Результат был неважным: из нескольких вариантов толкования слова они выбирали неподходящий по контексту. Перевод говорящих фамилий вроде Spike Lee (Защита Шипа) или Chevy Chase (Преследование Охоты) и вовсе стал показателем того, что использовать такие программы для серьезной работы невозможно.
Сейчас почти все электронные переводчики переквалифицировались и переместились в интернет, став сервисами. Большинство из них бесплатны и доступны каждому. Но по-прежнему остаются вопросы о корректности их работы и том, могут ли они заменить человека.
В список вошли переводчики от Google, Yandex, Microsoft и онлайн-версия Промта.
Образцами для перевода стали отрывки (в пределах 150 слов) из двух документов: резюме веб-разработчика и пункт «О поставке» дистрибьюторского соглашения. Выбор обусловлен большим количеством специфических юридических и технических терминов, а также стилистикой письма.
Оцениваться сервисы будут по пятибалльной шкале в двух категориях: «технический текст» и «юридический текст».
Один из самых популярных в мире сервисов, с собственным самообучаемым алгоритмом. Он использует статистический метод, основанный не на правилах какого-либо языка, а на анализе большого количества языковых пар и составлении собственной статистики употребления слов в том или ином контексте.
Попробуем его в действии. Загружаем резюме и получаем результат:
Первое, что бросается в глаза – несогласованность. Даже в пределах одного предложения имеются расхождения, что приводит к размытию общего смысла. При более внимательном прочтении можно заметить, что начало второго абзаца некорректно, но в третьем сервис от Google исправляется и все-таки находит нужную словоформу. Впрочем, дальше опять все плохо.
Перевод слов сам по себе довольно неплох. Стоит отметить, что сервис не определил название и попытался его переложить на русский.
Теперь испытаем его на знание юридических терминов:
И если с переводом технического текста результат был удовлетворительным, то здесь полностью утерян стиль и даже смысл:
Попытка привести такой текст хотя бы в читабельный вид (не говоря уже о нормах юридических текстов) обречена на долгие сверки с оригиналом, так что легче выполнить работу заново, но уже прибегнув к услугам профессионала.
Резюмируя, Google Translator получает:
за технический текст: 3 из 5 – хорошее общее качество, но с несогласованностью слов и предложений;
за юридический текст: 1 из 5 – это нельзя прочитать, отредактировать и уж тем более использовать в качестве официального документа.
Онлайн-сервис от небезызвестной российской компании PROMT, использующий собственные лингвистические технологии. Перечень языков не так велик, как у конкурента от Google, но охватывает практически все популярные языковые пары. Примечательна возможность выбора тематики текста из списка:
Загружаем в окно ввода отрывок из резюме и получаем:
Хотя автоматическое определение тематики не подвело, в целом результат хуже, чем у Google.
И опять прослеживается несогласованность пунктов, что вполне возможно исправить при наличии некоторого опыта.
Попробуем юридический текст:
Здесь система автоматического определения тематики не сработала и пришлось выбирать ее вручную. Проанализируем результат:
Подводя итог, отметим качество, сравнимое с результатом сервиса Google, но в юридической тематике удовлетворительных результатов по-прежнему нет.
Translate.ru получает:
за технический текст: 3 из 5 – при должной редактуре смысл и стиль изложения можно передать;
за юридический текст: 1 из 5 – нечитабельно, местами возвращение к результатам 2005 года.
Очередной сервис, на этот раз от российской компании Yandex. Тоже использует собственные алгоритмы, поддерживает 91 язык и умеет переводить тексты и веб-страницы.
Попробуем его в деле:
После анализа результата удивляет несколько решений алгоритма:
И это если не брать во внимание общую несогласованность.
Попробуем с отрывком из договора:
Проблемы все те же, что и у конкурентов, но удивляет другое.
Яндекс.Переводчик показал несколько сомнительных решений, появлением не связанных с оригинальным текстом слов и превращением строчных букв в заглавные и наоборот.
Мы даем Яндекс.Переводчику:
за технический текст: 2 из 5 – грамотный редактор исправит текст, но легче будет сделать всю работу заново;
за юридический текст: 1 из 5 – еще хуже, чем у конкурентов.
Последним в нашем тесте идет сервис от Microsoft. Он не настолько популярен в России, как остальные участники соревнования, но имеет свою аудиторию и стремительно развивает качество своих алгоритмов.
Оценим их текущую работоспособность:
Результат практически идентичен предыдущим. Все тот же частичный перевод названия и местоположения компании, несогласованность времени и рода слов. Смысл все еще присутствует.
Теперь юридический текст:
Здесь появляется несколько отличий от уже увиденного:
Как итог: практически те же показатели, что и у предыдущих испытуемых. Немного лучше в юридической части, но по-прежнему необходима серьезная работа редактора со знанием тематики.
Bing Translator получает:
за технический текст: 2 из 5 – несогласованность, частичный перевод;
за юридический текст: 2 из 5 – смысл раскрыт полнее, но утерян стиль юридического текста.
Ни один из протестированных. Где-то лучше с техническими текстами, где-то с юридическими, некоторые избирательно переводят и добавляют посторонние слова.
Как переводчик больших или нотариальных документов с английского на русский онлайн-сервис точно не подойдет. Он не сохраняет юридический стиль повествования и заставляет подолгу редактировать даже небольшой текст (а у нас был отрывок всего в 150 слов).
Одна из самых больших проблем машинного переложения текста с одного языка на другой – несогласованность.
Алгоритм не может полностью осмыслить контекст, он оперирует внутренними правилами и закономерностями. Из-за этого наблюдаются постоянные перескоки с одного времени на другое в пределах одного предложения, непредсказуемые изменения словоформ и внесение путаницы в некогда стройный текст.
Если у вас есть желание корпеть над выданным сервисом результатом, то можете пользоваться любым сервисом из вышеперечисленных. До уровня «хорошее качество» пока не дотягивает ни один из них.
Если вы хотите качественный перевод, в котором сохранена стилистика письма оригинала, то обращайтесь в нашу компанию. У нас работают переводчики, специализирующиеся на различных юридических направлениях и имеющие дополнительное техническое образование. Мы не упустим деталей оригинального текста и передадим все нюансы договора.