論文の概要: NaviDiffusor: Cost-Guided Diffusion Model for Visual Navigation
- arxiv url: http://arxiv.org/abs/2504.10003v1
- Date: Mon, 14 Apr 2025 09:06:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:49:46.007691
- Title: NaviDiffusor: Cost-Guided Diffusion Model for Visual Navigation
- Title(参考訳): NaviDiffusor:ビジュアルナビゲーションのためのコストガイド付き拡散モデル
- Authors: Yiming Zeng, Hao Ren, Shuhang Wang, Junlong Huang, Hui Cheng,
- Abstract要約: 本稿では,学習に基づく手法の強みと視覚ナビゲーションの古典的アプローチを組み合わせたハイブリッドアプローチを提案する。
提案手法はまず,様々な経路-RGB観測ペア上で条件拡散モデルを訓練する。
推論中は、異なるシーン固有のコストとタスクレベルのコストの勾配を統合し、拡散モデルを誘導し、制約を満たす有効なパスを生成する。
- 参考スコア(独自算出の注目度): 18.542828322750996
- License:
- Abstract: Visual navigation, a fundamental challenge in mobile robotics, demands versatile policies to handle diverse environments. Classical methods leverage geometric solutions to minimize specific costs, offering adaptability to new scenarios but are prone to system errors due to their multi-modular design and reliance on hand-crafted rules. Learning-based methods, while achieving high planning success rates, face difficulties in generalizing to unseen environments beyond the training data and often require extensive training. To address these limitations, we propose a hybrid approach that combines the strengths of learning-based methods and classical approaches for RGB-only visual navigation. Our method first trains a conditional diffusion model on diverse path-RGB observation pairs. During inference, it integrates the gradients of differentiable scene-specific and task-level costs, guiding the diffusion model to generate valid paths that meet the constraints. This approach alleviates the need for retraining, offering a plug-and-play solution. Extensive experiments in both indoor and outdoor settings, across simulated and real-world scenarios, demonstrate zero-shot transfer capability of our approach, achieving higher success rates and fewer collisions compared to baseline methods. Code will be released at https://github.com/SYSU-RoboticsLab/NaviD.
- Abstract(参考訳): モバイルロボティクスにおける基本的な課題であるビジュアルナビゲーションは、多様な環境を扱うために多用途ポリシーを要求する。
古典的な手法は、幾何学的解を利用して特定のコストを最小限に抑え、新しいシナリオに適応できるが、多モジュール設計と手作りの規則に依存するため、システムエラーを生じやすい。
学習ベースの手法は、高い計画の成功率を達成する一方で、トレーニングデータを超えて見えない環境に一般化することの難しさに直面し、しばしば広範囲なトレーニングを必要とする。
これらの制約に対処するために,学習に基づく手法の長所と,RGBのみのビジュアルナビゲーションのための古典的なアプローチを組み合わせたハイブリッドアプローチを提案する。
提案手法はまず,様々な経路-RGB観測ペア上で条件拡散モデルを訓練する。
推論中は、異なるシーン固有のコストとタスクレベルのコストの勾配を統合し、拡散モデルを誘導し、制約を満たす有効なパスを生成する。
このアプローチは、プラグイン・アンド・プレイソリューションを提供するため、再トレーニングの必要性を軽減します。
シミュレーションおよび実世界のシナリオにまたがる屋内および屋外の両方での大規模な実験は、我々のアプローチのゼロショット転送能力を示し、ベースライン法と比較して高い成功率と衝突の少ないことを証明した。
コードはhttps://github.com/SYSU-RoboticsLab/NaviD.comでリリースされる。
関連論文リスト
- Training-free Quantum-Inspired Image Edge Extraction Method [4.8188571652305185]
トレーニング不要で量子にインスパイアされたエッジ検出モデルを提案する。
提案手法は,古典的なソベルエッジ検出,シュリンガー波動方程式の洗練,ハイブリッドフレームワークを統合する。
トレーニングの必要性をなくすことで、モデルは軽量で多様なアプリケーションに適用できます。
論文 参考訳(メタデータ) (2025-01-31T07:24:38Z) - Generalizable Spacecraft Trajectory Generation via Multimodal Learning with Transformers [14.176630393074149]
本稿では,様々な問題構成にまたがって一般化する新しいトラジェクトリ生成フレームワークを提案する。
我々は、データソースから学習できる高容量トランスフォーマーニューラルネットワークを活用している。
このフレームワークはフリーフライアプラットフォームでのシミュレーションと実験を通じて検証されている。
論文 参考訳(メタデータ) (2024-10-15T15:55:42Z) - Model predictive control-based value estimation for efficient reinforcement learning [6.8237783245324035]
データ駆動型アプローチにより環境をモデル化するモデル予測制御に基づく改良された強化学習手法を設計する。
学習した環境モデルに基づいて、値関数を推定し、ポリシーを最適化する多段階予測を行う。
本手法は, 学習効率の向上, 局所最適値に傾向のある戦略の収束速度の向上, 経験的再生バッファに必要なサンプル容量の削減を実現する。
論文 参考訳(メタデータ) (2023-10-25T13:55:14Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - Experimental study of Neural ODE training with adaptive solver for
dynamical systems modeling [72.84259710412293]
アダプティブと呼ばれるいくつかのODEソルバは、目の前の問題の複雑さに応じて評価戦略を適用することができる。
本稿では,動的システムモデリングのためのブラックボックスとして適応型ソルバをシームレスに利用できない理由を示すための簡単な実験について述べる。
論文 参考訳(メタデータ) (2022-11-13T17:48:04Z) - Learning Control Admissibility Models with Graph Neural Networks for
Multi-Agent Navigation [9.05607520128194]
制御適応モデル(CAM)は、任意の数のエージェントに対するオンライン推論のために簡単に構成され、使用することができる。
CAMモデルは少数のエージェントしか持たない環境で訓練でき、数百のエージェントで密集した環境に展開するために容易に構成でき、最先端の手法よりも優れた性能を実現することができる。
論文 参考訳(メタデータ) (2022-10-17T19:20:58Z) - Adaptive Decision Making at the Intersection for Autonomous Vehicles
Based on Skill Discovery [13.134487965031667]
都市環境では、複雑で不確実な交差点のシナリオは自動運転にとって困難である。
安全性を確保するためには、他の車両とのインタラクションを処理できる適応的な意思決定システムを開発することが不可欠である。
知識を自律的に蓄積し再利用できる階層的な枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-24T11:56:45Z) - Switchable Representation Learning Framework with Self-compatibility [50.48336074436792]
自己整合性(SFSC)を考慮した交換可能な表現学習フレームワークを提案する。
SFSCは1つのトレーニングプロセスを通じて、異なる能力を持つ一連の互換性のあるサブモデルを生成する。
SFSCは評価データセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-06-16T16:46:32Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - IQ-Learn: Inverse soft-Q Learning for Imitation [95.06031307730245]
少数の専門家データからの模倣学習は、複雑な力学を持つ高次元環境では困難である。
行動クローニングは、実装の単純さと安定した収束性のために広く使われている単純な方法である。
本稿では,1つのQ-関数を学習することで,対向学習を回避する動的適応型ILを提案する。
論文 参考訳(メタデータ) (2021-06-23T03:43:10Z) - Scalable Bayesian Inverse Reinforcement Learning [93.27920030279586]
我々はAVRIL(Adroximate Variational Reward Imitation Learning)を紹介する。
本手法は,逆強化学習問題の誤った性質に対処する。
本手法を従来の制御シミュレーションと並行して実際の医療データに適用し,現在の手法の範囲を超えた環境におけるベイズ報酬推論を実証する。
論文 参考訳(メタデータ) (2021-02-12T12:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。