С первого взгляда
Компьютерное зрение — способность машины «видеть» объекты или изображения и понимать увиденное — уже способно помочь вам разблокировать новый iPhone, просто взглянув на него. Но чтобы суметь опознать предмет, компьютеру необходимо увидеть его заранее.
Однако исследователи в Лаборатории искусственного интеллекта Массачусетского технологического института разработали систему компьютерного зрения, которая способна идентифицировать объект, который она ранее не видела. Это является важным шагом к созданию роботов, способных двигаться и думать подобно человеку.
Эти результаты будут представлены в октябре на конференции, посвящённой обучению роботов, в Цюрихе в Швейцарии.
Уникальные перспективы
Команда в МТИ назвала свою систему «Плотные Объектные Сети» (ПОС). ПОС способна «видеть», рассматривая объекты как массив точек, из которого она строят трёхмерную «визуальную карту». Это означает, что учёным не требуется заниматься скучным присваиванием меток массивным наборам данных, как того требуют другие системы машинного зрения.
Знакомое, но не идентичное
Когда ПОС видит объект, похожий на ранее встречавшийся, она способна идентифицировать разные части этого нового объекта. Например, после того, как ПОС была показана туфля, и ее обучили поднять её за носок, система сумела так же поднять и другие туфли, даже хотя она не видела их до того, или когда туфли были в другом положении.
«Многие методы, применяемые в манипулировании объектами, не способны идентифицировать части предмета, если он принимает различные положения, — говорит исследователь Лукас Мануэлли в пресс-релизе. — Например, существующие алгоритмы не могут взять кружку за ручку, особенно, если кружка находится в разных положениях — стоит на донышке или лежит на боку».
Роботы завтрашнего дня
Эта продвинутая система компьютерного зрения способна сделать многое, что пока недоступно роботам. Мы можем получить робота, который сумеет сортировать движущиеся по конвейеру предметы в центре переработки вторсырья, и при этом ему не понадобится обучение на больших массивах данных. Или мы даже сможем показать такому самостоятельному роботу изображение с прибранным столом, и поручить ему навести порядок на другом.
Таким образом, это ещё один шаг в направлении к машинам, столь же ловким, как и человек. Затем останется только наблюдать, насколько более ловкими, чем мы, они смогут стать.