論文の概要: Prior Does Matter: Visual Navigation via Denoising Diffusion Bridge Models
- arxiv url: http://arxiv.org/abs/2504.10041v1
- Date: Mon, 14 Apr 2025 09:42:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:49:45.427197
- Title: Prior Does Matter: Visual Navigation via Denoising Diffusion Bridge Models
- Title(参考訳): 優先事項:拡散ブリッジモデルによる視覚ナビゲーション
- Authors: Hao Ren, Yiming Zeng, Zetong Bi, Zhaoliang Wan, Junlong Huang, Hui Cheng,
- Abstract要約: そこで我々は,NaviBridgerという名前の拡散ブリッジモデルを利用した新しいビジュアルナビゲーションフレームワークを提案する。
このアプローチは、情報的事前行動から開始することで行動生成を可能にし、認知プロセスにおけるガイダンスと効率性を高める。
シミュレーションおよび実世界の屋内シナリオおよび屋外シナリオにおける実験は、NaviBridgerがポリシー推論を加速し、ターゲットアクションシーケンスの生成においてベースラインを上回っていることを示す。
- 参考スコア(独自算出の注目度): 17.339359071659494
- License:
- Abstract: Recent advancements in diffusion-based imitation learning, which show impressive performance in modeling multimodal distributions and training stability, have led to substantial progress in various robot learning tasks. In visual navigation, previous diffusion-based policies typically generate action sequences by initiating from denoising Gaussian noise. However, the target action distribution often diverges significantly from Gaussian noise, leading to redundant denoising steps and increased learning complexity. Additionally, the sparsity of effective action distributions makes it challenging for the policy to generate accurate actions without guidance. To address these issues, we propose a novel, unified visual navigation framework leveraging the denoising diffusion bridge models named NaviBridger. This approach enables action generation by initiating from any informative prior actions, enhancing guidance and efficiency in the denoising process. We explore how diffusion bridges can enhance imitation learning in visual navigation tasks and further examine three source policies for generating prior actions. Extensive experiments in both simulated and real-world indoor and outdoor scenarios demonstrate that NaviBridger accelerates policy inference and outperforms the baselines in generating target action sequences. Code is available at https://github.com/hren20/NaiviBridger.
- Abstract(参考訳): 拡散型模倣学習の最近の進歩は、多モーダル分布のモデリングと訓練安定性において顕著な性能を示し、様々なロボット学習タスクにおいて顕著な進歩をもたらした。
視覚ナビゲーションでは、従来の拡散に基づくポリシーは、ガウスノイズの発声から開始することでアクションシーケンスを生成するのが一般的である。
しかし、ターゲットの行動分布はガウスノイズから大きく分岐することが多く、冗長なデノナイズステップと学習の複雑さが増大する。
さらに、効果的な行動分布の空間性は、ガイダンスなしで正確な行動を生成する政策を困難にしている。
これらの問題に対処するために,NaviBridger という名前の拡散ブリッジモデルを利用した新しい統合ビジュアルナビゲーションフレームワークを提案する。
このアプローチは、情報的事前行動から開始することで行動生成を可能にし、認知プロセスにおけるガイダンスと効率性を高める。
本稿では,拡散ブリッジが視覚ナビゲーションタスクにおける模倣学習をいかに促進させるかを検討するとともに,先行動作を生成するための3つのソースポリシーについて検討する。
シミュレーションおよび実世界の屋内および屋外シナリオにおける広範囲な実験は、NaviBridgerがポリシー推論を加速し、ターゲットアクションシーケンスの生成においてベースラインを上回っていることを示す。
コードはhttps://github.com/hren20/NaiviBridger.comで入手できる。
関連論文リスト
- NavigateDiff: Visual Predictors are Zero-Shot Navigation Assistants [24.689242976554482]
慣れ親しんだ環境をナビゲートすることは、家庭用ロボットにとって大きな課題となる。
既存の強化学習手法は、直接新しい環境に移行することはできない。
我々は、事前学習された基礎モデルの論理知識と一般化能力をゼロショットナビゲーションに転送しようと試みる。
論文 参考訳(メタデータ) (2025-02-19T17:27:47Z) - Object-Centric Latent Action Learning [70.3173534658611]
本稿では,VideoSaur と LAPO に基づくオブジェクト中心の潜在行動学習手法を提案する。
無関係な背景雑音から因果的エージェント・オブジェクトの相互作用を効果的に切り離し、トラクタによる性能劣化を低減する。
Distracting Control Suite を用いた予備実験では、オブジェクト分解に基づく遅延動作事前学習により、x2.7 による推論遅延動作の品質が向上し、ラベル付きアクションの小さなセットによる下流微調整の効率が向上し、平均 x2.6 での戻り率が向上することが示された。
論文 参考訳(メタデータ) (2025-02-13T11:27:05Z) - Latent Action Priors for Locomotion with Deep Reinforcement Learning [42.642008092347986]
深層強化学習(DRL)は、ロボットが環境との相互作用を通じて複雑な行動を学ぶことを可能にする。
本稿では,特にトルク制御に有用な移動学習のための帰納バイアスを提案する。
エージェントは実演の報酬レベルに制限されず、転送タスクの性能は大幅に向上する。
論文 参考訳(メタデータ) (2024-10-04T09:10:56Z) - Diffusion-Reinforcement Learning Hierarchical Motion Planning in Adversarial Multi-agent Games [6.532258098619471]
部分的に観察可能なマルチエージェント追従ゲーム(PEG)における回避目標の動作計画タスクに焦点をあてる。
これらの追尾回避問題は、捜索・救助活動や監視ロボットなど、様々な応用に関係している。
環境データに応答するグローバルパスを計画するために,高レベル拡散モデルを統合する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-16T03:53:55Z) - ActionDiffusion: An Action-aware Diffusion Model for Procedure Planning in Instructional Videos [10.180115984765582]
ActionDiffusionは、講義ビデオにおけるプロシージャ計画のための新しい拡散モデルである。
本手法は,行動間の時間的依存関係の学習と拡散過程における行動計画の認知を統一する。
論文 参考訳(メタデータ) (2024-03-13T14:54:04Z) - Towards Deviation-Robust Agent Navigation via Perturbation-Aware
Contrastive Learning [125.61772424068903]
視覚言語ナビゲーション(VLN)は、エージェントに与えられた言語命令に従って実際の3D環境をナビゲートするように要求する。
本稿では,既存のVLNエージェントの一般化能力を高めるために,PROPER(Progressive Perturbation-aware Contrastive Learning)と呼ばれるモデルに依存しない学習パラダイムを提案する。
論文 参考訳(メタデータ) (2024-03-09T02:34:13Z) - DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion [137.8749239614528]
そこで我々は,時間的行動検出(TAD)の新しい定式化を提案し,拡散を抑えるDiffTADを提案する。
入力されたランダムな時間的提案を考慮すれば、トリミングされていない長いビデオが与えられたアクションの提案を正確に得ることができる。
論文 参考訳(メタデータ) (2023-03-27T00:40:52Z) - AntPivot: Livestream Highlight Detection via Hierarchical Attention
Mechanism [64.70568612993416]
本稿では,Livestream Highlight Detectionという新たなタスクを定式化し,上記の課題を議論・分析し,新しいアーキテクチャAntPivotを提案する。
我々は、このタスクをインスタンス化し、我々のモデルの性能を評価するために、完全に注釈付きデータセットAntHighlightを構築した。
論文 参考訳(メタデータ) (2022-06-10T05:58:11Z) - Adversarial Reinforced Instruction Attacker for Robust Vision-Language
Navigation [145.84123197129298]
自然言語に基づくナビゲーションタスクでは,言語指導が重要な役割を担っている。
より堅牢なナビゲータを訓練し、長い指導から重要な要素を動的に抽出する。
具体的には,航法士が間違った目標に移動することを誤認することを学習する動的強化命令攻撃装置(DR-Attacker)を提案する。
論文 参考訳(メタデータ) (2021-07-23T14:11:31Z) - Generative Adversarial Reward Learning for Generalized Behavior Tendency
Inference [71.11416263370823]
ユーザの行動嗜好モデルのための生成的逆強化学習を提案する。
我々のモデルは,差別的アクター批判ネットワークとWasserstein GANに基づいて,ユーザの行動から報酬を自動的に学習することができる。
論文 参考訳(メタデータ) (2021-05-03T13:14:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。