論文の概要: AURA: Multimodal Shared Autonomy for Real-World Urban Navigation
- arxiv url: http://arxiv.org/abs/2604.01659v1
- Date: Thu, 02 Apr 2026 05:59:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.470044
- Title: AURA: Multimodal Shared Autonomy for Real-World Urban Navigation
- Title(参考訳): AURA:現実世界の都市ナビゲーションのためのマルチモーダル共有オートノミー
- Authors: Yukai Ma, Honglin He, Selina Song, Wayne Wu, Bolei Zhou,
- Abstract要約: 複雑な都市環境でのロングホライゾンナビゲーションは、連続した人間の操作に大きく依存している。
AURA(Assistive Urban Robot Autonomy)は、都市ナビゲーションを高レベルなヒューマンインストラクションと低レベルなAI制御に分解する新しいマルチモーダルフレームワークである。
AURAは、効果的に人間の指示に従い、手動操作の労力を減らし、ナビゲーションの安定性を改善し、オンライン適応を可能にしている。
- 参考スコア(独自算出の注目度): 49.419374037785815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-horizon navigation in complex urban environments relies heavily on continuous human operation, which leads to fatigue, reduced efficiency, and safety concerns. Shared autonomy, where a Vision-Language AI agent and a human operator collaborate on maneuvering the mobile machine, presents a promising solution to address these issues. However, existing shared autonomy methods often require humans and AI to operate within the same action space, leading to high cognitive overhead. We present Assistive Urban Robot Autonomy (AURA), a new multi-modal framework that decomposes urban navigation into high-level human instruction and low-level AI control. AURA incorporates a Spatial-Aware Instruction Encoder to align various human instructions with visual and spatial context. To facilitate training, we construct MM-CoS, a large-scale dataset comprising teleoperation and vision-language descriptions. Experiments in simulation and the real world demonstrate that AURA effectively follows human instructions, reduces manual operation effort, and improves navigation stability, while enabling online adaptation. Moreover, under similar takeover conditions, our shared autonomy framework reduces the frequency of takeovers by more than 44%. Demo video and more detail are provided in the project page.
- Abstract(参考訳): 複雑な都市環境での長距離航行は、疲労、効率の低下、安全上の懸念をもたらす連続的な人間の操作に大きく依存している。
ビジョンランゲージのAIエージェントと人間のオペレーターが、モバイルデバイスの操作に協力する共有自律性は、これらの問題に対処するための有望なソリューションを提供する。
しかしながら、既存の共有自律手法では、人間とAIが同じアクション空間内で運用する必要がある場合が多いため、認知的オーバーヘッドが高くなる。
AURA(Assistive Urban Robot Autonomy)は、都市ナビゲーションを高レベルなヒューマンインストラクションと低レベルなAI制御に分解する新しいマルチモーダルフレームワークである。
AURAには空間認識命令エンコーダが組み込まれており、様々な人間の指示を視覚的・空間的コンテキストと整合させる。
遠隔操作と視覚言語記述を含む大規模データセットであるMM-CoSを構築した。
シミュレーションと実世界の実験により、AURAは人間の指示を効果的に追従し、手動操作の労力を減らし、ナビゲーションの安定性を向上し、オンライン適応を可能にした。
さらに、同様のテイクオーバ条件下では、私たちの共有自律フレームワークは、テイクオーバの頻度を44%以上削減します。
デモビデオと詳細はプロジェクトのページにある。
関連論文リスト
- AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild [62.47761809929869]
視覚言語ナビゲーション(VLN)は、視覚的観察とともに言語指示を解釈することで、知的エージェントが環境をナビゲートする必要がある。
無人航空機(UAV)の現在のVLN研究は、所定のルートに沿ってUAVを誘導するための詳細な指示に依存している。
本稿では,自律型UAVナビゲーションのためのエンド・ツー・エンドのビジョン・ランゲージ・アクションモデルであるAutoFlyを提案する。
論文 参考訳(メタデータ) (2026-02-10T11:08:07Z) - Follow-Me in Micro-Mobility with End-to-End Imitation Learning [0.0]
模倣学習が従来手動で調整されたコントローラよりもスムーズで総合的に優れたコントローラを提供することを示す。
本稿では、エンドツーエンド制御のための異なるニューラルネットワークアーキテクチャを分析し、実世界の実運用レベルのデプロイメントにおけるそれらのユーザビリティを実証する。
論文 参考訳(メタデータ) (2025-11-07T11:24:20Z) - End-to-End Dexterous Arm-Hand VLA Policies via Shared Autonomy: VR Teleoperation Augmented by Autonomous Hand VLA Policy for Efficient Data Collection [10.217810309422232]
マクロモーションとマイクロモーションの制御を分割するフレームワークを提案する。
人間のオペレーターが直感的なVR遠隔操作を通してロボットの腕のポーズをガイドします。
自律的なDexGrasp-VLAポリシは、リアルタイム触覚と視覚フィードバックを使用して、きめ細かい手制御を処理する。
論文 参考訳(メタデータ) (2025-10-31T16:12:02Z) - Towards Autonomous Micromobility through Scalable Urban Simulation [52.749987132021324]
現在のマイクロモビリティは、主に人手操作(対人・遠隔操作)に依存している。
本研究では,自律型マイクロモビリティを実現するため,スケーラブルな都市シミュレーションソリューションを提案する。
論文 参考訳(メタデータ) (2025-05-01T17:52:29Z) - IG-MCTS: Human-in-the-Loop Cooperative Navigation under Incomplete Information [22.47189812250736]
CoNav-Mazeは、人間のオペレータが不正確な地図に基づいてガイダンスを提供する間、ロボットが局所的な知覚でナビゲートするシミュレーション環境である。
我々は,自律移動と情報通信を協調的に最適化する情報ゲインモンテカルロ木探索(IG-MCTS)を提案する。
IG-MCTSはコミュニケーション要求を著しく減らし、認知負荷の低下を示す視線追跡指標を得る。
論文 参考訳(メタデータ) (2025-02-03T22:08:04Z) - Learning Robust Autonomous Navigation and Locomotion for Wheeled-Legged Robots [50.02055068660255]
都市環境のナビゲーションは、ロボットにとってユニークな課題であり、移動とナビゲーションのための革新的なソリューションを必要としている。
本研究は, 適応移動制御, 移動対応ローカルナビゲーション計画, 市内の大規模経路計画を含む, 完全に統合されたシステムを導入する。
モデルフリー強化学習(RL)技術と特権学習を用いて,多目的移動制御系を開発した。
私たちのコントローラーは大規模な都市航法システムに統合され、スイスのチューリッヒとスペインのセビリアで自律的、キロメートル規模の航法ミッションによって検証されます。
論文 参考訳(メタデータ) (2024-05-03T00:29:20Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of
Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。
私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文 参考訳(メタデータ) (2022-03-28T19:09:11Z) - Robot Perception enables Complex Navigation Behavior via Self-Supervised
Learning [23.54696982881734]
本稿では、強化学習(RL)によるアクティブな目標駆動ナビゲーションタスクのためのロボット認識システムの統合手法を提案する。
提案手法は,1つの画像列から直接自己スーパービジョンを用いて得られる,コンパクトな動きと視覚知覚データを時間的に組み込む。
我々は,新しいインタラクティブなCityLearnフレームワークを用いて,実世界の運転データセットであるKITTIとOxford RobotCarのアプローチを実証した。
論文 参考訳(メタデータ) (2020-06-16T07:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。