Нейронные сети применяют практически везде. Они делают прогнозы, проводят сложные вычисления, умеют генерировать статьи, рассказы, рисовать картины. А что насчет читабельных переводов – возможно ли это, насколько близки обработанные тексты к оригиналу и правда ли, что ИИ скоро заменит переводчиков. Давайте разбираться.
Конечно, ведь все пользуются Google.Translate. Сейчас алгоритмы распознают речь, проводят транслитерацию подписей к изображениям и даже могут воспроизвести в аудио формате, как звучит фраза на французском, китайском или даже несуществующем эльфийском.
А начиналось все в конце 1940, с разработки концепции машинной обработки информации. В 1954 году был проведен Джорджтаунский эксперимент, когда машина правильно перевела 60 предложений с русского на английский и даже поправила орфографические ошибки в словах.
Результаты эксперимента, правда позже подверглись критике, поскольку предложения были простыми, однозначными по смыслу. То есть у машины просто не было шанса ошибиться. Но так появилась технология Rule-Based Machine Translation (RBMT), основанная на грамматических правилах.
Вторая модель SMT, которая широко используется и сейчас (самостоятельно и совместно с другими технологиями), была разработана в 2000-х. Она сопоставляет массивы загруженных данных – тексты на языке исходника и переведенные человеком. Алгоритмы анализируют статистику смыслового сочетания слов в предложениях в первом и втором блоках данных и на основании этих данных выбирают верный вариант.
В ноябре 2016 Гугл представил Google’s Neural Machine Translation, который использовал только нейросети, анонсировав, что программа переходит на глубинное обучение. Новая модель уже не разбивает предложения на слова, а фокусируется на фразе, сопоставляя ее с другими фразами, что позволяет точнее передать смысл. Что до обучения, то Google’s Neural Machine Translation может «понимать» языковые пары, которым его не учили.
На самом деле приложений много. Есть платные и бесплатные, специализированные (для программистов, медиков или юристов, например) и для широкой аудитории. Расскажем о самых известных:
Все программы распознают речь, умеют автоматически определять подписи на фото. Могут сами редактировать готовые документы, а Smodin еще и оценивает работы авторов, проверяет на плагиат.
А еще появились сервисы с помощью которых можно работать с видео. HeyGen – нейронка для почти профессионального дубляжа на французский, испанский португальский, индийский, сохраняя голос персонажа в кадре. И это еще не все. Нейронка адаптирует мимику человека и движение губ, поэтому видеоряд выглядит реалистично. Оценить, на что способна HeyGen, можно по многочисленным переозвученным роликам-мемам.
Программы для переводов помогают в учебе, используются для работы и развлечений. Из главных преимуществ:
Но минусы тоже есть. И главный – неточность. Это, в общем признает даже Chat GPT, подтверждая, что результат обработки информации зависит от программных настроек и типа решаемых задач.
Искусственный интеллект не понимает игру слов в художественных произведениях и не может передать эмоциональную окраску. При обработке узкоспециализированных документов могут искажать смысл или давать неверную трактовку отдельным определениям. Поэтому юридическую, техническую документацию им лучше не доверять.
Технологии развиваются, становятся умнее. Алгоритмы могут достаточно точно передавать общий смысл исходника и уже не допускают грубых ошибок, как это было еще лет 5 назад. Но говорить о том, что нейронные сети скоро заменят человека пока очень рано, скорее, их можно считать помощником.