Обучение машин тому, чтобы они могли по-настоящему понимать естественный язык, было одной из самых сложных задач, стоящих перед компьютерными учеными, работающими над продвижением искусственного интеллекта. Компания Google смогла добиться реального прогресса в том, чтобы компьютеры рассматривали язык как нечто большее, чем просто набор слов, и эти достижения в настоящее время внедряются во все их продукты.
Например, с внедрением нейронного машинного перевода (NMT) коренным образом преобразовался переводчик Google Translate. Уже сегодня можно заметить значительные улучшения качества любых переводов с хинди, русского и вьетнамского языков. Это стало очередным шагом вслед за первым использованием NMT в Translate в ноябре прошлого года, когда претерпели улучшения переводчики с английского, французского, немецкого, испанского, португальского, китайского, японского, корейского и турецкого.
«У нас всего 103 языка, и наша цель состоит в том, чтобы они все работали с нейронными сетями», — сказал официальный представитель Google. Он добавил, что переводы с остальных языков будут включены ещё не скоро, и точное время неизвестно, потому что Google запускает каждый новый язык только тогда, когда достигнут высокий уровень, превосходящий возможности существующей системы. Иногда это получается быстро, как с сегодняшними версиями переводчиков с хинди, русского и вьетнамского.
Переводчик Google всегда считался полезной штукой, но в целом был слабоват. С его помощью можно было ещё понять, что означает на другом языке какое-то слово, но он уже не мог точно переводить отдельные фразы. Теперь с этим новым подходом переводы на Google Search, translate.google.com, в приложениях Google и, в конечном счёте, автоматический перевод страниц в Chrome станет значительно совершеннее и будет, наконец, отражать особенности естественного языка.
«Нейронный перевод намного лучше, чем наша предыдущая технология, потому что теперь мы одновременно переводим целые предложения, а не их куски», — написал в новостной ленте блога Барак Туровский, являющийся ведущим специалистом по Google Translate.
Ранее Google полагался на технологию фразового машинного перевода (PBMT), предусматривающую разбитие входных предложений на слова и фразы, которые потом переводятся независимо друг от друга. Однако, новый NMT перевод рассматривает все предложение как единую структуру и переводит его с учётом этой целостности. NMT использует глубокие нейронные сети, которые позволяют компьютеру понимать ситуации, с которыми он при обучении не сталкивался прежде, благодаря новой информации. В данном случае некоторые наборы, используемые программой для обучения — это данные из сообщества Google Translate Community, где обычные пользователи со всего мира переводят предложения со своих языков.
Не все языки будут подключены в течение ближайших месяцев, но следующая их партия ожидается уже через несколько недель.