論文の概要: DM$^3$-Nav: Decentralized Multi-Agent Multimodal Multi-Object Semantic Navigation
- arxiv url: http://arxiv.org/abs/2604.22014v1
- Date: Thu, 23 Apr 2026 19:07:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.241548
- Title: DM$^3$-Nav: Decentralized Multi-Agent Multimodal Multi-Object Semantic Navigation
- Title(参考訳): DM$^3$-Nav:分散マルチエージェントマルチモーダルマルチオブジェクトセマンティックナビゲーション
- Authors: Amin Kashiri, Atharva Jamsandekar, Yasin Yazıcıoğlu,
- Abstract要約: DM$3$-Navは、完全に分散化されたマルチエージェントセマンティックナビゲーションシステムである。
DM$3$-Navはマルチモーダルなオープン語彙の目標仕様とマルチオブジェクトミッションをサポートする。
- 参考スコア(独自算出の注目度): 2.5580163831188685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present DM$^3$-Nav, a fully decentralized multi-agent semantic navigation system supporting multimodal open-vocabulary goal specification and multi-object missions. In our setting, decentralization implies operation without a central coordinator, global map aggregation, or shared global state at runtime. Robots operate autonomously and coordinate through ad-hoc pairwise communication, exchanging local maps, goal status, and navigation intent without synchronization. An implicit task allocation mechanism combining intent broadcasting and distance-weighted frontier selection reduces redundant exploration while preserving decentralized operation. Evaluations on HM3DSem scenes using the HM3Dv0.2 and GOAT-Bench datasets demonstrate that DM$^3$-Nav matches or exceeds centralized and shared-map baselines while eliminating single points of failure inherent in centralized architectures. Finally, we validate our approach in a real-world office environment using two mobile robots, demonstrating successful deployment relying entirely on onboard sensing and computation. A video of our real-world experiments is available online: https://drive.google.com/file/d/1QiUSCn5rIvtuTUqtuXLPgmt6S8x9-MCZ/view?usp=drive_link
- Abstract(参考訳): DM$^3$-Navは、マルチモーダルなオープン語彙目標仕様とマルチオブジェクトミッションをサポートする、完全に分散化されたマルチエージェントセマンティックナビゲーションシステムである。
我々の設定では、分散化は中央コーディネータ、グローバルマップアグリゲーション、実行時の共有グローバルステートなしでの運用を意味する。
ロボットは自律的に動作し、アドホックなペアワイズ通信を通じて協調し、同期なしでローカルマップ、ゴールステータス、ナビゲーションインテントを交換する。
インテントブロードキャストと距離重み付きフロンティア選択を組み合わせた暗黙的なタスク割り当て機構は、分散化された操作を保ちながら冗長な探索を低減する。
HM3Dv0.2およびGOAT-Benchデータセットを用いたHM3DSemシーンの評価では、DM$^3$-Navは集中型アーキテクチャ固有の単一障害点を排除しつつ、集中型と共有型マップのベースラインに一致または超えている。
最後に,2台の移動ロボットを用いて実環境のオフィス環境におけるアプローチを検証する。
実世界の実験のビデオがオンラインで公開されている。 https://drive.google.com/file/d/1QiUSCn5rIvtuTUqtuXLPgmt6S8x9-MCZ/view?
usp=drive_link
関連論文リスト
- GoalSwarm: Multi-UAV Semantic Coordination for Open-Vocabulary Object Navigation [0.0]
GoalSwarmは、ゼロショットセマンティックなオブジェクトゴールナビゲーションのための、完全に分散化されたマルチUAVフレームワークである。
それぞれのUAVは、共有された軽量な2Dトップダウンセマンティック占有マップを共同で構築する。
GoalSwarmのコアコントリビューションは,(1)ゼロショット基盤モデルの統合 – オープン語彙検出とピクセルレベルのセグメンテーションのためのSAM3,(2)複数視点検出の信頼性を画素ごとのゴール関連分布に融合するベイズ値マップである。
論文 参考訳(メタデータ) (2026-03-13T11:23:53Z) - ReasonNavi: Human-Inspired Global Map Reasoning for Zero-Shot Embodied Navigation [53.95797153529148]
身体的エージェントは、主に部分的な自我中心の観測に依存するため、効率的なナビゲーションに苦しむことが多い。
本稿では,マルチモーダル大規模言語モデル(MLLM)と決定論的プランナを結合することにより,この理由に基づくパラダイムを運用する,人間にインスパイアされたフレームワークであるReasonNaviを紹介する。
論文 参考訳(メタデータ) (2026-01-26T19:09:20Z) - TP-MDDN: Task-Preferenced Multi-Demand-Driven Navigation with Autonomous Decision-Making [90.18833928208333]
Task-Preferenced Multi-Demand-Driven Navigation (TP-MDDN)は、複数のサブオンデマンドと明示的なタスク嗜好を含む長距離ナビゲーションのための新しいベンチマークである。
空間記憶のために,3次元点雲蓄積と2次元意味マッピングを組み合わせたMASMapを設計した。
本手法は,認識精度とナビゲーションの堅牢性の両方において,最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-11-21T13:12:13Z) - DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.888688171010365]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。
我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-28T04:46:13Z) - Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation Using Vision Language Models [8.668211481067457]
Co-NavGPTは、ビジョン言語モデル(VLM)をグローバルプランナーとして統合する新しいフレームワークである。
Co-NavGPTは、多様な視点を持つ複数のロボットのサブマップを統一されたグローバルマップに集約する。
VLMはこの情報を使って、ロボット全体のフロンティアを割り当て、協調的で効率的な探索を容易にする。
論文 参考訳(メタデータ) (2023-10-11T23:17:43Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Centralizing State-Values in Dueling Networks for Multi-Robot
Reinforcement Learning Mapless Navigation [87.85646257351212]
本稿では,CTDE(Training and Decentralized Execution)パラダイムにおけるマルチロボットマップレスナビゲーションの問題点について考察する。
この問題は、各ロボットが観察を他のロボットと明示的に共有することなく、その経路を考えると困難である。
我々は,集中型状態値ネットワークを用いて共同状態値を計算するCTDEの新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-16T16:47:00Z) - Learning Synthetic to Real Transfer for Localization and Navigational
Tasks [7.019683407682642]
ナビゲーションは、コンピュータビジョン、ロボット工学、制御の概念を組み合わせて、複数の分野のクロスロードにある。
この研究は、実世界への移動をできる限り少ない努力で行うことができるナビゲーションパイプラインをシミュレーションで作成することを目的としていた。
ナビゲーションパイプラインを設計するには、環境、ローカライゼーション、ナビゲーション、計画の4つの大きな課題が発生する。
論文 参考訳(メタデータ) (2020-11-20T08:37:03Z) - Kimera-Multi: a System for Distributed Multi-Robot Metric-Semantic
Simultaneous Localization and Mapping [57.173793973480656]
本稿では,高密度メカニカル・セマンティックSLAMのための完全分散マルチロボットシステムを提案する。
私たちのシステムはKimera-Multiと呼ばれ、視覚慣性センサーを備えたロボットチームによって実装されています。
Kimera-Multiは環境の3Dメッシュモデルをリアルタイムで構築し、メッシュの各面にセマンティックラベルをアノテートする。
論文 参考訳(メタデータ) (2020-11-08T21:38:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。