Slam навигация что это
SLAM — Simultaneous Localization And Mapping — Метод одновременной навигации и построения карты — метод, используемый роботами и автономными транспортными средствами для построения карты в неизвестном пространстве или для обновления карты в заранее известном пространстве с одновременным контролем текущего местоположения и пройденного пути.
Метод одновременной навигации и построения карты (SLAM) — это концепция, которая связывает два независимых процесса в непрерывный цикл последовательных вычислений, при котором результаты одного процесса участвуют в вычислениях другого процесса.
Построение карты — это проблема интеграции информации, собранной с датчиков робота. При этом процессе, робот как бы отвечает на вопрос: «Как выглядит мир?»
Главными аспектами в построении карты являются представление данных об окружающей среде и интерпретация данных датчиков.
Напротив, локализация — это проблема определения местоположения робота на карте. При этом, робот как бы отвечает на вопрос «Где я?»
Локализацию можно разделить на два вида — локальная и глобальная.
Локальная локализация позволяет отследить местоположение робота на карте, когда его начальное местоположение известно, а глобальной локализация — это определение местоположения робота на незнакомом месте (например, при похищении робота).
Т.о. метод одновременной навигации и построения карты (SLAM) — это проблема построения карты и локализации робота на этой карте. На практике, эти две проблемы не могут быть решены независимо друг от друга. Прежде чем робот сможет ответить на вопрос о том, как выглядит окружающая среда (исходя из серии наблюдений), он должен знать, где эти наблюдения были сделаны. В то же время, трудно оценить текущее положение робота без карты.
Вот и выходит, что SLAM является типичной проблемой курицы и яйца: карта необходима для локализации, а локализация необходима для создания карты.
Кроме того, сложность определения текущего местоположения и построения карты, обусловлена низкой точностью приборов, участвующих в процессе вычисления текущего местоположения.
GMapping — реализация метода SLAM на основе данных от лазерного дальномера и одометрии робота (подробности на OpenSLAM.org).
Но вместо лазерного дальномера вполне можно использовать и Kinect.
Это уже реализовано и используется на роботе TurtleBot — SLAM Map Building with TurtleBot:
Testing ROS with the gmapping package
VSLAM — Visual SLAM — визуальный SLAM — реализация метода SLAM на основе методов компьтерного зрения
стек vslam — экспериментальная попытка реализации визуального SLAM-а.
Визуальный SLAM — направление очень интересное и перспективное, но так как метод основывается на отслеживании ключевых точек (features, keypoints) на изображении, поступающем с камер робота, то когда камера движется быстро (например, при поворотах робота), возникает размытие изображения и возможности для отслеживания ключевых точек теряются и алгоритм перестаёт работать.
rgbdslam — пакет, для регистрации облака точек с RGBD датчиков, таких как Kinect или стерео-камеры.
Nikolas Engelhard and Felix Endres and Jürgen Hess and Jürgen Sturm and Wolfram Burgard, «Real-time 3D visual SLAM with a hand-held RGB-D camera», 2011. (PDF)
hector_mapping — SLAM для платформ без одометрии — только на основе данных от LIDAR-ов. Использует высокую скорость обновления современных систем лазерного сканирования, например, Hokuyo UTM-30LX и обеспечивает данные оценки 2D-положения со скоростью сканирования датчиков (40Гц для UTM-30LX).
karto — SLAM на основе одометрии робота и данных лазерного дальномера.
находятся в процессе разработки:
ScaViSLAM — фреймворк для визуального SLAM-а
H. Strasdat, A.J. Davison, J.M.M. Montiel, and K. Konolige, Double Window Optimisation for Constant Time Visual SLAM Accepted for the IEEE International Conference on Computer Vision (ICCV), 2011. (PDF)
mrpt_slam — оболочка для использования методов SLAM из библиотек MRPT (Mobile Robot Programming Toolkit)
Русские Блоги
SLAM ≠ Автономное позиционирование и навигация роботов
Технология SLAM как ключевая технология автономного передвижения роботов заставила многих людей неправильно понять: SLAM = автономное позиционирование и навигация роботов.
на самом деле,SLAM ≠ Автономное позиционирование и навигация роботов, Не решает проблему действий.
Для решения проблемы интеллектуального движения роботов, помимо технологии SLAM, вам также необходимо присоединитьсяПланирование пути и контроль движения. После того, как технология SLAM помогает роботу определить свое собственное положение и построить карту, он выполняет функцию, называемую навигацией по целевой точке. С точки зрения непрофессионала, это означает спланировать путь от точки A до точки B, а затем позволить роботу двигаться дальше.
Автономное позиционирование и навигация роботов = SLAM + планирование пути и управление движением
Планирование движения в основном делится на:Глобальное планирование、Частичная планировка.
Глобальное планирование
Глобальное планирование, как следует из названия, представляет собой логику планирования движения верхнего уровня. Оно находит самый быстрый путь к целевой точке на карте в соответствии с предварительно записанной картой окружающей среды робота в сочетании с текущей позой робота и положением целевой точки задачи.
Местное планирование
Когда окружающая среда меняется или путь, запланированный верхним уровнем, не способствует фактическому ходьбе робота (например, робот встречает препятствия во время ходьбы), планирование локального пути будет точно настроено.
Отличие от глобального планирования заключается в том, что местное планирование может не знать, куда движется робот, но оно особенно хорошо помогает избегать препятствий перед роботом.
Два уровня модулей планирования работают вместе, и робот может хорошо реализовать интеллектуальное движение из точки А в точку Б. Однако в реальной рабочей среде вышеуказанной конфигурации недостаточно. Потому что процесс планирования движения также включает статические карты и динамические карты.
A*алгоритм
D*алгоритм
Вышеупомянутые алгоритмы представляют собой алгоритмы планирования пути, необходимые большинству роботов в настоящее время. Они могут сделать роботов такими же умными, как люди, быстро спланировать кратчайший путь из точки A в точку B и знать, как преодолевать препятствия. ноПодметающий роботПоскольку это один из первых сервисных роботов, появившихся на потребительском рынке, алгоритм планирования пути, который ему нужен, является более сложным.
Покрытие пространства
Функции, необходимые для подметающего робота, отличаются от функций роботов, представленных на рынке.Например, для I-образной очистки возврата, как очистить эффективно, не повторяя очистку? Как заставить подметальщиков понимать концепции комнат, дверей и коридоров, как людей?
В ответ на эти проблемы в академических кругах давно появилась специальная тема исследования, называемая охватом пространства, а также было предложено множество алгоритмов и теорий. Среди них наиболее известен «Разложение Морзе», с помощью которого подметальная машина делит пространство, а затем очищает его.
Поэтому он хочет не реализовывать алгоритм от A до B как можно скорее. Чтобы максимально очистить дом, он должен попытаться охватить все области от A до B, чтобы реализовать функцию подметающих роботов, «подметающих пол».
Таким образом, для развития технологий автономного позиционирования и навигации роботов по-прежнему требуется все больше и больше технологий для их поддержки, что подходит для большего числа сценариев. Хотя технологии и спрос меняются, неизменным остается то, что отрасль не изменится, чтобы учиться друг у друга и интегрировать различные новые технологии.
Система навигации и построения карт vSLAM
В современных роботах-пылесосах используются новейшие технологии, позволяющие строить и прокладывать наиболее оптимальный маршрут во время уборки. С этой целью используется метод одновременной навигации и построения карты, известный как SLAM (Simultaneous Localization And Mapping). Часто встречается обозначение VSLAM, где символ V означает «визуальный». Данный метод помогает выстроить карту в совершенно незнакомом пространстве или обновить уже существующий маршрут. Одновременно контролируется текущее положение пылесоса и его пройденный путь.
История развития интеллекта роботов
У самых первых роботов-пылесосов отсутствовала картография, режимы движения vslam, поэтому их перемещение по квартире было беспорядочным и хаотичным. В наиболее продвинутых моделях к этому режиму добавлялось движение по спирали и вдоль стен. В дальнейшем, навигация несколько улучшилась и стала способна оценивать примерную квадратуру по некоторым явным признакам. В основном, использовалось количество ударов при столкновении робота с препятствиями. Если это происходило слишком часто, значит у этого помещения небольшие размеры.
Позднее умные пылесосы были оборудованы дополнительным приспособлением – маячком-координатором, закрывающим устройство в ограниченном пространстве на определенное время. Эти маяки устанавливались в дверных проемах и запирали агрегат в той или иной комнате на заданное время. Таким образом, зоны и режим уборки распределялись равномерно, однако, оставалась проблема пропусков мест, остающихся неубранными.
Через некоторое время система навигации устройств дополнилась камерой. В результате, пылесос охватывал все доступные площади и не оставлял загрязненных мест. Одновременно, он запоминал место, где находится база для зарядки. Постепенно модели роботов еще более совершенствовались и значительно «поумнели» с появлением слэма – метода SLAM.
Что такое SLAM
Метод SLAM состоит из двух независимых процессов, одновременно включающих в себя навигацию и построение карты маршрута. Во время его действия выполняются последовательные вычисления, проводимые в непрерывном цикле. Полученные результаты оказываются взаимосвязаны, уточняя и дополняя друг друга.
Отвечая на вопрос, что такое slam следует отметить, что для построения карты требуется сбор информации, поступающей от датчиков, ее последующая интеграция и обработка. По итогам анализа полученных данных, составляется представление об окружающем пространстве.
В то же самое время выполняется локализация, определяющая расположение пылесоса на полученной карте. Условно она разделяется на два типа – локальную и глобальную. В первом случае положение робота известно заранее, а во втором – локализация осуществляется для незнакомого места. Последний вариант, помимо основной задачи, дает возможность найти похищенный пылесос.
Таким образом, метод SLAM заключается в одновременном построении карты и локализации объекта на этой карте. Эти задачи решаются в комплексе не могут выполняться вне зависимости между собой. То есть, карта нужна для локализации, а локализация требуется для того, чтобы создать карту. Определенные трудности в этом процессе создает относительно низкая точность приборов, принимающих участие в вычислениях.
Построение карт SLAM
Карты помещений строятся двумя методами – камерами (рис. 1) и лазерным дальномером (рис. 2). В первом варианте используется навигация vslam – выполняется фотографирование поверхностей и дверных проемов. Полученные данные сохраняются в памяти устройства и применяются в дальнейшей работе.
Некоторые модели для обработки информации пользуются технологией NST, которая делает сравнение фотографий, полученных с камеры. Эти данные необходимы в дальнейшем для корректировки маршрута. Таким образом, камерная технология обеспечивает более качественное построение карт помещений, сокращает количество ошибок и захватывает большие площади для уборки.
Второй метод – лазерный был впервые использован американской компанией Neato. В каждой модели был установлен лазерный дальномер, расположенный в специальной башенке сверху корпуса. Основная задача данного устройства заключается в измерениях расстояний от пылесоса до предметов, встречающихся на его пути.
Карты SLAM в роботах-пылесосах
Современные пылесосы оборудованы обеими технологиями – камерной и лазерной. Наиболее популярными моделями считаются следующие:
SLAM, VSLAM, LDS: разбираемся, какой тип навигации для робота-пылесоса лучше?
SLAM, VSLAM, LDS: разбираемся, какой тип навигации для робота-пылесоса лучше?
PROJECT OVERVIEW
Практически все интернет ресурсы, бесчисленное множество обзоров и статей сообщат вам, что тип навигации – важнейший фактор, на который первоочередно стоит обратить свое внимание, приобретая робот-пылесос. Запутаться в этой тематике просто, ведь рынок ежегодно расширяется, пополняясь усовершенствованными девайсами. Спешим на помощь и подробно разбираем три самых популярных типа навигации, существующих на сегодняшний день.
SLAM-навигация
Несколько лет назад такой тип навигации считался наиболее «продвинутым», сейчас же практически все премиальные модели ориентируются в пространстве с помощью камеры или лидара. Несмотря на это, модели, оснащенные SLAM-навигацией, все еще выпускаются и активно продаются.
Почему SLAM-навигация остается популярной при существовании двух других более совершенных типов?
Как работает SLAM-навигация?
SLAM-навигация позволяет девайсу строить карту в незнакомом месте и проецировать ее повторно на уже известной территории. В начале работы прибор запоминает точку старта и обрисовывает в своей памяти проложенный путь, что позволяет ему не повторяться и оперативно справляться с поставленной задачей. Сведения об окружающей среде робот-пылесос получает благодаря инфракрасным сенсорам, обычно установленным на бампере устройства. Современные роботы-пылесосы дают возможность просматривать карту помещения в приложении на мобильных гаджетах.
Яркий представитель: Panda Evo
VSLAM + камера
Доработанная версия навигационной системы, описанной пунктом ранее. Оснащение девайсов камерой позволяет за считанные секунды анализировать пространство, запоминая расположение предметов по территории и используя потолок для ориентирования. Такой формат выстраивает более точный план очистки помещения, который можно просмотреть в мобильном приложении. Отличие от первого типа: пользователь может взаимодействовать с картой. Приложение открывает доступ к выстраиванию виртуальных стен и обозначению конкретных мест для локальной очистки.
Яркий представитель: Okami U90
Лазерная навигация на базе лидара
Переходим к самому совершенному типу навигации, фигурирующему практически во всех премиальных моделях роботов-пылесосов. Лидар – конструкция в виде башенки, установленная на корпусе устройства и оснащенная высокоточным лазером. Именно он собирает информацию из внешней среды о предметах и расстояниях до них.
Лидар позволяет наиболее точным и быстрым образом анализировать пространство. Вдобавок процесс сканирования теперь возможен даже при темном освещении, что несвойственно для навигации на базе камеры.
Яркий представитель: Okami U100
Что же лучше?
Однозначный ответ на данный вопрос отсутствует. Все три типа навигации обладают своими достоинствами и правильно соотносятся со стоимостью устройства. Конечно, самыми прорывными и технологичными являются модели, оснащенные лидаром. Они способны убирать габаритные помещения, функционировать ночью и быстрее всех справляться с обязанностями.
Однако и более бюджетные модели эффективно приберут вашу жилплощадь. При выборе устройства опирайтесь на метраж помещения, особенности планировки и доступный вам бюджет. Современный рынок предлагает сотню вариантов, среди них обязательно найдется нужный робот-пылесос.
Исследование методов SLAM для навигации мобильного робота внутри помещений. Опыт исследования R2 Robotics
Введение
В настоящее время существует множество видов навигации автономных беспилотных аппаратов и роботов. В целом их можно разделить на навигацию внутри помещений – indoor, и вне помещений – outdoor.
В свою очередь, навигация внутри помещений также направлена на решение множества задач. Как правило, это мобильные роботы, предназначенные для перемещения грузов на складе, роботы пылесосы, роботы для мерчандайзинга, интерактивного общения с клиентами, официанты и т.д. Когда мы переходим к навигации внутри помещений, то сразу теряем все преимущества спутниковой навигации, потому что спутниковый сигнал, как правило, не достигает устройств сквозь бетонные и металлические конструкции. С другой стороны, благодаря тому что пространство внутри зданий зачастую ограниченно относительно небольшими площадями, можно воспользоваться такими средствами навигации, как триангуляция, навигация по различным меткам (QR коды с указанием последующих команд для робота, сигнальные линии по ходу движения, метки на стенах для коррекции местоположения), SLAM навигация, а также комбинации вышеперечисленных методов.
Представленные методы навигации кардинально отличаются по применяемым технологиям и имеют свои преимущества и недостатки. В данной статье будет рассмотрен только метод SLAM навигации, который является наиболее перспективным из перечисленных для работы в неисследованном пространстве. Данный метод интересен тем, что может использоваться в неподготовленном и неизвестном роботу помещении для создания карты и последующего её использования. Стоит учитывать, что для работы SLAM требуются различные источники данных, в том числе, одометрия.
1. SLAM
SLAM от англ. расшифровывается как Одновременная Локализация и Картографирование (Simultaneous Localization and Mapping). Данный метод навигации используется для определения местоположения и ориентации автономных роботов на заранее неизвестной им местности, а также, для обновления или дополнения уже известных карт окружающего пространства.
В целом, принцип работы SLAM происходит следующим образом. Роботу необходимо в каждый момент времени знать свое местоположение, а также, постепенно сканировать окружающее пространство при помощи сенсоров, составляя, таким образом, карту местности. Карта строится постепенно, по мере исследования роботом новых областей. Основным источником информации о местоположении робота является одометрия, полученная тем или иным образом (колеса, компьютерное зрение, IMU или их комбинация). Однако, по мере выстраивания карты, робот начинает сверяться с картой. Например, если робот проезжает по той области помещения, которую он уже отсканировал, происходит сверка по определенным паттернам. В результате, если аппарат понимает, что текущие показания одометрии не соответствуют показаниям карты, происходит корректировка одометрии.
С математической точки зрения, SLAM пытается оценить карту и весь путь, пройденный роботом. Таким образом, поза робота рассчитывается только в конце траектории, проделанной роботом. Вероятностное определение подхода полного SLAM может быть дано следующим образом [1]:
где u представляет собой управление роботом в момент времени t
где z представляет собой информацию об окружающей среде, обозреваемой роботом в момент времени t
где m представляет собой построенную карту, а x – полученное местоположение робота в момент времени t. Таким образом, для расчета траектории робота, можно все представить в таком виде (рисунок 1):
Рисунок 1 – Графическая модель SLAM подхода [1]
При использовании SLAM отображение карты может быть как в 2D, так и в 3D. Отображение геометрии местности в 3D является более сложным и, как правило, требует больше памяти. Однако, это не всегда позволяет обеспечить качественное понимание окружающей среды, поэтому двухмерного отображения достаточно для большинства задач. Помимо этого, методы SLAM можно разделить по используемым подходам SLAM для представления карт. Например, SLAM, основанные на сетке точек (grid-based), на основе распознавания уникальных объектов (feature-based) и на основе графиков (graph-based) для более разреженных изображений, топологические (topological) для распознавания типов местоположений и семантические (semantic) для более высокого уровня понимания окружающей среды [1].
1.1 Feature-based SLAM
Feature-based SLAM используют легко идентифицируемые элементы в среде и создают внутреннее представление о пространстве с учетом местоположения этих ориентиров. Исторически самый ранний и наиболее влиятельный SLAM алгоритм основан на расширенном фильтре Калмана (EKF – Extended Kalman Filter).
1.2 Graph-based SLAM
SLAM на основе графов или сетей также пытается создать карту с помощью графа, узлы которого соответствуют позициям робота в разные моменты времени, а ребра представляют собой пространственные ограничения, связывающие позы робота вместе. Ограничения состоят в распределении вероятностей относительного преобразования между позами. Используя граф, построенный на основе измерений датчиков, система определяет наиболее вероятную конфигурацию поз с учетом ребер графа. Одним из наиболее популярных подходов к SLAM на основе графов является метод отображения в реальном времени (VSLAM Rtabmap), основанный на инкрементном детекторе замыкания цикла на основе визуальных образов [1].
1.3 Grid-based SLAM
Теоретически наиболее простым методом является подход на основе сетки. При таком подходе среда разбивается на сетку точек определенного размера. Каждая точка может быть занята препятствием, не занята или не исследована. Например, ячейка со значением 1 будет считаться занятой, а другая со значением 0 будет полностью свободной [1]. Также значение точки может варьироваться от 0 до 1 при помощи промежуточных значений.
1.4 Topological SLAM
Топологическое представление проблемы SLAM направлено на создание графо-подобного описания окружающей среды, а не точной метрической карты. В топологическом описании узлы могут соответствовать значимым местам, которые легко различить. Основополагающей идеей этого подхода было то, что люди и животные не создают точных карт окружающей среды, в которой они находятся. Как правило, эти методы подходят для навигации в простых средах и применять их в более сложных и больших средах затруднительно [1].
1.5 SemanticSLAM
Представление карт также может быть выполнено в виде моделей семантических карт. В отличие от топологических подходов, где отображение фильтрует метрическую информацию и использует только распознавание мест для различения местоположения, семантическое сопоставление связывает семантические концепции с объектами в окружающей среде. Семантическое отображение все еще находится на ранних стадиях разработки и, в зависимости от уровня необходимых семантических возможностей, оно может быть очень сложным для реализации. Несмотря на это, согласно Carlos Miguel [1] было проведено множество исследований по семантическому отображению и семантическому SLAM [7, 9].
1.6 Современные методы SLAM
В настоящее время SLAM навигация получила распространение на Robotic Operating System (ROS) в качестве пакетов, зачастую находящихся в открытом доступе, например: GMapping [2], Cartographer [3], Rtabmap [4, 9]. Данные пакеты были выбраны для исследования поскольку являются достаточно широко известными и популярными для работы с ROS. Таким образом, имеется большое количество информации касательно настройки и использования данных SLAM, а также поддержка со стороны разработчиков.
Gmapping создает карту благодаря данным с лидара. Как правило, используется 2D лидар, способный сканировать окружающее пространство на 360 градусов вокруг. Далее, происходит сопоставление готовой карты и данных с лидара, в результате чего оценивается и корректируется местоположение робота.
Рисунок 2 – Карта Gmapping
Стоит также сказать об адаптивном алгоритме локализации Монте-Карло (Adaptive Monte Carlo Localization – AMCL). Это алгоритм для локализации, использующийся как фильтр частиц для отслеживания позиции робота на карте [5]. Основной его принцип работы заключается в том, что алгоритм предполагает множество позиций, где может находиться робот, даже если задана начальная позиция. По мере движения робота, алгоритм сопоставляет «очертания карты» и данные с лидара. Таким образом, постепенно, множество предполагаемых позиций робота сходится к локальной точке, считающейся истинным местоположением робота в пространстве.
Google Cartographer схож с GMapping в том, что может строить карту по 2D лидару и данных с одометрии. Однако, в отличие от Gmapping, он обладает намного более богатым функционалом. Например, Cartographer имеет более сложную градацию точек, из которых состоят карты – cells. По мере исследования одного и того же участка местности, Cartographer плавно меняет параметр точек карты с «неизвестно» на «исследовано» с флагом «свободно» либо «препятствие» [3]. В результате, Cartographer имеет меньшую вероятность пропустить какие-либо объекты на карте. Это особенно заметно во время резких поворотов из-за угла, когда робот может сканировать определенный участок местности только короткий промежуток времени. Оператор (алгоритм автоматического картографирования) будет вынужден вернуться к этому участку ещё раз, как правило с другого ракурса и закончить исследование той области, где исследование завершено не полностью.
Рисунок 3 – Карта Cartographer [3]
Основная особенность данного метода заключается в том, что он состоит из локального SLAM и глобального SLAM. Локальный SLAM создает отдельные небольшие части карты. Затем, глобальный SLAM алгоритм ищет совпадения между частями карт, а также между данными сенсоров и всеми картами, созданными при помощи локального SLAM в параллельных процессах. В результате, глобальный SLAM формирует единую карту окружающего пространства [3, 6].
Рисунок 4 – Схема работы алгоритма Google Cartographer [3]
Помимо этого, Cartographer умеет работать с 3D картами [3, 6]. Это несомненный плюс для летательных аппаратов, а также для мобильных роботов с большими габаритами. С другой стороны, это потребует большей вычислительной мощности.
Также, в отличие от более простого GMapping, Cartographer может работать с несколькими лидарами одновременно (к примеру, на разной высоте для создания 3D карты), а также с RGBD и стерео-камерами, благодаря которым возможно получить гораздо больше информации об окружающем пространстве.
В целом, Cartographer – это гибкий в настройке SLAM. Он более требовательный к ресурсам, чем GMapping, но позволяет получить более качественный результат.
Rtabmap – это метод SLAM, основанный на поиске и сопоставлении соответствий визуальных данных сенсоров с использованием механизма памяти, где хранится база данных визуальных образов в соответствии с данными о местоположении робота [4, 7, 8, 9].
Механизм визуальной навигации работает следующим образом. Rtabmap обрабатывает каждое новое входящее 2D изображение, выделяя в нем основные особенности, которые могут быть использованы для сравнения данного изображения с прочими. Каждому такому изображению сопоставляются данные о местоположении и ориентации робота в пространстве в момент получения изображения. Таким образом составляется база данных визуальных образов и координат, в которых они были получены. Одновременно с этим, каждое новое полученное изображение сравнивается с уже имеющимися в базе изображениями по ряду признаков.
Рисунок 5 – База данных изображений Rtabmap и поиск соответствий
Если же коэффициент соответствия достаточно высокий, алгоритм считает, что робот в настоящий момент находится в уже ранее исследованном месте и, если это необходимо, корректирует одометрию. Стоит отметить, что такой подход сильно зависит от качества получаемых изображений, а также от участка местности, где происходит картографирование. Например, Rtabmap будет плохо работать в симуляции, где все стены и объекты одинаковые, либо в реальном помещении, если кроме стен в нем практически ничего не присутствует – многие изображения идентичны. Rtabmap имеет множество настроек, что делает его довольно гибким. К примеру, можно настроить количество паттернов, вычленяемых из изображения, а также задать – сколько из них должны совпадать для того, чтобы считать изображение соответствующим уже имеющемуся в базе и т. д. Более подробно особенности Rtabmap будут описаны в следующем разделе.
Параллельно с этим, строится 2D карта пространства, в котором передвигается робот. Rtabmap может работать с широким набором сенсоров и их комбинацией: лидары, RGBD камеры, стерео-камеры, одометрия, IMU. В качестве источника данных для карты могут выступать как лидар, так и RGBD камеры или стерео-камеры. Однако необходимо выбрать один единственный тип используемых сенсоров. В то время как лидар изначально сканирует 2D плоскость, данные о препятствиях от RGBD камер и стерео-камер проецируются на 2D карту при помощи внутренних инструментов Rtabmap. В результате, на карту наносятся все препятствия, и «свободные» области, которые робот исследовал при помощи сенсоров.
По мере исследования аппаратом местности, база визуальных образов становится больше. Таким образом, со временем Rtabmap начинает реализовывать свой функционал локализации. Когда робот возвращается в ранее исследованное место, алгоритм позволяет сопоставить текущие значения одометрии и значения, записанные ранее в память с привязкой к изображению. Это позволяет уменьшить накапливающуюся ошибку одометрии и, что не менее важно, скорректировать 2D карту местности. Rtabmap может немного перестроить уже созданную часть карты, если понимает, что эта часть была сохранена с ошибкой в одометрии. Таким образом, алгоритм убирает накопленную ошибку, а карта становится более точная. Данный процесс можно заметить невооруженным глазом, когда робот сначала исследует определенную часть карты с одной стороны, а затем заканчивает исследование этого же участка карты с противоположной стороны. В результате, места «склеек» корректируются и карта становится завершенной.
Как уже было сказано, помимо данных о препятствиях в окружающем робота пространстве, для работоспособности SLAM требуются данные о местоположении робота – одометрия. Здесь также предоставляется выбор – это может быть встроенная в Rtabmap визуальная одометрия, либо любой внешний источник данных (одометрия с колес, источник внешней визуальной одометрии, IMU, либо их комбинация). Точность одометрии, безусловно, является очень важным параметром, поскольку, чем быстрее данные будут накапливать постоянную ошибку, тем меньше вероятность, что SLAM будет адекватно эту самую ошибку нивелировать.
Сравнение SLAM
Рисунок 6 – Симуляция помещения (600 м2) в Gazebo
Для небольшого помещения вполне достаточно стандартного GMapping. Данный алгоритм хорошо справляется с локализацией по данным лидара. К сожалению, в процессе тестирований в симуляции выяснилось, что при исследовании аппаратом достаточно большого помещения (использовалась симуляция помещения 30х20 м), периодически алгоритм не справляется со «склейкой» некоторых частей 2D карты, в результате чего, различные участки карты попросту накладываются друг на друга и дальнейшая работа с ней невозможна.
Рисунок 7 – карта симуляции построенная по лидару а) Gmapping b) Rtabmap
Единственная выявленная закономерность заключается в том, что составление карты нарушается после исследования определенной площади. Дальнейшие тесты было решено не проводить и перейти к более функциональным и гибким методам SLAM.
Google Cartographer обладает большей гибкостью в плане настроек и выбора сенсоров. Возможность использования не только лидаров, но также камер глубины позволяет получить большее количество информации. Также, Cartographer позволяет без проблем составлять карты больших по площади помещений.
В отличие от GMapping и Cartographer, Rtabmap SLAM строит не только 2D карту, но и создает базу данных визуальных образов. Таким образом, Rtabmap ищет глобальные совпадения по визуальным образам, в то время как составленная карта помещения может использоваться лидаром для локальной корректировки местоположения робота в пространстве.
Выбор конфигурации SLAM
В целом было решено выделить две конфигурации настроек Rtabmap. Первая позволяет строить карту по данным лидара, в то время как вторая строит карту по данным с RGBD камеры. Глобальный механизм навигации в обоих случаях производится по визуальным образам, согласно основному принципу работы данного SLAM.
Соответственно, также выбраны две конфигурации Cartographer – с использованием лидара и RGBD камеры. Поскольку Cartographer также позволяет использовать различные сенсоры, его можно сравнить с Rtabmap в разных конфигурациях.
Метод построения карты с лидара позволяет, как правило, построить более наглядную схему помещения, на которой будут видны все стены, объемная мебель, перегородки и прочие объекты. На такой карте проще ориентироваться, если, например, требуется построить маршрут для робота, либо понять, где в настоящее время он находится. Однако, у карт, построенных подобным образом имеется существенный недостаток – лидар сканирует только одну 2D плоскость, расположенную на каком-либо зафиксированном уровне (имеется в виду стандартный 2D лидар, т. к. существуют лидары, сканирующие 3D пространство, однако их стоимость в разы больше, чем стоимость не только 2D лидаров, но также RGBD и стерео-камер).
Во время процесса картографирования потенциальные препятствия находятся на разных уровнях по вертикальной оси. В случае, когда мобильный робот имеет низкий профиль (робот пылесос), это не так сильно влияет на эффективность картографирования, поскольку большинство препятствий, находящихся в пределах высоты робота все же будут распознаны лидаром. Более того, в некоторых случаях это будет преимуществом – например, робот низкого профиля может проехать под столом, стулом и прочими предметами мебели, у которых объем занимаемого пространства меняется в зависимости от высоты. Из-за того, что лидар сканирует непосредственно определенную плоскость пространства, он сможет зафиксировать только те части препятствий, которые находятся на одной с ним высоте. В результате, низкопрофильный робот будет обращать внимание только на те объекты (части объектов) на его пути, с которыми он потенциально может столкнуться.
Если же робот имеет крупные габариты, особенно в высоту, данный способ картографирования не сможет определить все объекты, представляющие опасность. Данную проблему можно решить несколькими способами. Во-первых, можно использовать несколько лидаров на разных уровнях высоты. Однако, невозможно заранее предположить, на каких именно высотах могут располагаться препятствия. Во-вторых, можно строить карту при помощи одного лидара, а в дополнение использовать камеру глубины, которая будет фиксировать препятствия, но не будет наносить их на карту (Rtabmap не позволяет строить карту с использованием данных и с лидара и с камер глубины одновременно, если только не конвертировать всё в формат данных лидара). Данные о препятствиях будут использоваться только для локальной временной карты в стеке навигации ROS. Таким образом, робот будет создавать легко читаемую карту и, в то же время, будет способен определить все препятствия, которые ему необходимо избегать в процессе передвижения.
Несмотря на то, что на карте, построенной по лидару находятся не все препятствия, создание такой карты имеет и положительные стороны для навигации. Rtabmap может использовать лидар не только для определения препятствий, но также сопоставлять карту и данные лидара в текущий момент при помощи функции ICP (Iterative Closest Point). Если же положение робота по данным лидара не соответствует карте, алгоритм корректирует текущие координаты робота. По причине того, что карта по данным лидара имеет на порядок меньше шумов, её использование совместно с функцией ICP даст более качественный результат, нежели использование ICP на карте, построенной по камере глубины.
Данный функционал полезен в случае, если одометрия накопила ошибку, либо когда робот движется по определенному участку в направлении противоположном тому, в котором этот участок был изначально исследован. Поскольку глобальная навигация Rtabmap происходит по визуальным образам, то, во время исследования, робот видит изображения как правило перед собой. Тогда как при движении в противоположном направлении, он не сможет находить визуальные образы, соответствующие тем, которые он сохранил. Конечно, это можно нивелировать путем исследования одних и тех же участков помещения дважды – двигаясь по ним в противоположных направлениях, однако это увеличивает время, затрачиваемое на картографирование.
Метод построения карты с использованием камер глубины изначально способен сканировать объемное пространство. В таком случае алгоритм будет наносить на карту проекции всех объектов, которые он сканирует в процессе движения робота. В результате, полученная карта будет менее наглядная, но более полноценная и безопасная для передвижений робота. Более того, планировщик пути робота будет строить свой маршрут сразу учитывая все объекты; в то время как при использовании карты, построенной по лидару, робот сначала подъедет к незафиксированному этим самым лидаром препятствию, затем распознает его при помощи камеры и, только после этого, перестроит свой маршрут.
Обе представленные конфигурации Rtabmap способны справиться с задачей навигации крупногабаритного робота внутри помещения. Таким образом, принято решение протестировать оба варианта и оценить полученные результаты. Также решено проверить эффективность работы этих сенсоров с Cartographer.
Заключение
В итоге, нами были рассмотрены такие современные SLAM алгоритмы как Gmapping, Rtabmap и Google Cartographer. Каждый из них имеет свои особенности, которые будут являться преимуществами для одного робота и недостатками для другого. Например Gmapping – это базовый SLAM, не требующий высокой вычислительной мощности. Как следствие, его можно использовать для небольших простых роботов с необходимостью картографирования и локализации при помощи 2D лидара. В то же время, Cartographer и Rtabmap являются уже более ресурсоемкими пакетами и требуют соответствующей вычислительной мощности, в также наличие определенных сенсоров (камера для Rtabmap). Однако, возможности данных алгоритмов на порядок выше – качество картографирования на сложной местности превосходит простой Gmapping.
В следующей части статьи будет представлено тестирование SLAM алгоритмов непосредственно на практике.
Список источников
Pedrosa, E., L. Reis, C. M. D. Silva and H. S. Ferreira. Autonomous Navigation with Simultaneous Localization and Mapping in/outdoor. 2020.
Gmapping [Электронный ресурс] URL: http://wiki.ros.org/gmapping, свободный ресурс – Загл. с экрана. Язык англ. Дата обращения: 14.08.2020 г.
Google Cartographer ROS [Электронный ресурс] URL: https://google-cartographer-ros.readthedocs.io/en/latest/#, свободный ресурс – Загл. с экрана. Язык англ. Дата обращения: 04.11.2020 г.
RTAB-Map, Real-Time Appearance-Based Mapping [Электронный ресурс] URL: http://introlab.github.io/rtabmap/, свободный ресурс – Загл. с экрана. Язык англ. Дата обращения: 22.06.2020 г.
Adaptive Monte Carlo localization [Электронный ресурс] URL: http://wiki.ros.org/amcl, свободный ресурс – Загл. с экрана. Язык англ. Дата обращения: 03.08.2020 г.
Building Maps Using Google Cartographer and the OS1 Lidar Sensor [Электронный ресурс] URL: https://ouster.com/blog/building-maps-using-google-cartographer-and-the-os1-lidar-sensor/, свободный ресурс – Загл. с экрана. Язык англ. Дата обращения: 25.02.2021 г.
Labbé, M, Michaud, F. RTAB‐Map as an open‐source lidar and visual simultaneous localization and mapping library for large‐scale and long‐term online operation. J Field Robotics. 2019; 35: 416– 446.
Silva, B.M.F.D.; Xavier, R.S.; Gonçalves, L.M.G. Mapping and Navigation for Indoor Robots under ROS: An Experimental Analysis. Preprints 2019.
Mathieu Labbé and François Michaud. Online Global Loop Closure Detection for LargeScale Multi-Session Graph-Based SLAM. 2014 IEEE/RSJ International Conference on Intelligent Robots and Systems, pages 2661–2666, 2014.