Как улучшить распознавание объектов роботами

"Картографирование" роботами среды, в которой они находятся, может сделать существующие алгоритмы распознавания объектов более точными 25 Август 2015, 12:06
Группа Джона Леонарда (John Leonard) на факультете машиностроения MIT специализируется в области одновременной локализации и составления карты местности (SLAM, simultaneous localization and mapping), метода, с помощью которой мобильные автономные роботы осуществляют «картографию» среды, в которой они находятся, и определяют свое местоположение. На прошлой неделе, на конференции по робототехнике и робототехническим системам, члены группы Леонарда представили новую работу, демонстрирующую, как SLAM может использоваться для улучшения систем распознавания объектов, которые будут жизненно важными компонентами будущих роботов, умеющих манипулировать объектами, находящимися вокруг них произвольным образом.
Система использует информацию SLAM для улучшения существующих алгоритмов распознавания объектов. Возможности этого метода должны улучшаться при разработке специалистами по компьютерному зрению нового ПО для распознавания, и разработке робототехниками более совершенного программного обеспечения, реализующего метод SLAM.
Предлагаемая система распознавания объектов на основе SLAM способна локализовать и распознать различные объекты, окружающие робота, сочетая распознавания с разных точек обзора. Подписи объектов на изображении – реальные предположения системы
Несмотря на работу с существующими алгоритмами SLAM и распознавания объектов, и несмотря на использование только данных от обычной видеокамеры, производительность созданной системы уже сравнима с робототехническими системами распознавания объектов специального назначения по степени измерения глубины сцены и визуальной информации.
Поскольку система может комбинировать информацию, полученную под разными ракурсами камеры, она достигает лучшего результата, чем системы распознавания объектов, пытающиеся идентифицировать объекты по статичному изображению. 
Перед тем как сделать предположение, какие объекты содержатся на изображении, новые системы распознавания объектов пытаются определить границы между объектами. На основе предварительного анализа цветовых переходов они делят изображение на прямоугольные части, которые возможно содержат объекты определенного вида. Затем они запускают алгоритм распознавания по пикселам, находящимся внутри каждого прямоугольника.
Чтобы получить хороший результат, классической системе распознавания объектов может понадобиться перерисовывать эти прямоугольники тысячи раз. С различных ракурсов, например, два объекта, находящихся рядом, могут выглядеть как один, особенно если они одинаково окрашены. Система должна будет проверить предположение, что это целостный объект, а также предположение, что это раздельные объекты.
Поскольку SLAM-отображение трехмерно, оно дает лучшие результаты распознавания объектов, которые находятся рядом друг с другом, чем может дать анализ в одном ракурсе. Система использует SLAM для проведения сегментации изображений, полученных ее камерой перед передачей их алгоритму распознавания объектов. Таким образом она требует меньше времени на анализ ложных предположений.
SLAM-данные позволяют системе устанавливать соотношение между сегментированными изображениями, полученными с разных ракурсов. Анализ сегментов изображений, которые возможно представляют одни и те же объекты с разных углов, увеличивает производительность системы.
«Возможность определять объекты очень важна для роботов, которые должны выполнять полезные задачи в повседневной среде, — говорит Дитер Фокс (Dieter Fox), профессор вычислительной техники и машиностроения Вашингтонского университета. — Эта работа показывает очень многообещающие результаты того, как робот может сочетать информацию, полученную с разных точек обзора, для эффективного и точного определения объектов».

Источник