論文の概要: Dynamic programming with partial information to overcome navigational
uncertainty in a nautical environment
- arxiv url: http://arxiv.org/abs/2112.14657v1
- Date: Wed, 29 Dec 2021 17:09:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-12-30 16:19:38.921931
- Title: Dynamic programming with partial information to overcome navigational
uncertainty in a nautical environment
- Title(参考訳): 海洋環境における航法不確実性克服のための部分情報を用いた動的プログラミング
- Authors: Chris Beeler, Xinkai Li, Mark Crowley, Maia Fraser, Isaac Tamblyn
- Abstract要約: 部分的に観察されたマルコフ決定過程に関する部分的な情報のみを知っていれば,動的プログラミングが利用できることを示す。
モデルに不確実性を組み込むことで,安全を維持するためのナビゲーションポリシーを構築することができることを示す。
- 参考スコア(独自算出の注目度): 1.805933123016726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using a toy nautical navigation environment, we show that dynamic programming
can be used when only partial information about a partially observed Markov
decision process (POMDP) is known. By incorporating uncertainty into our model,
we show that navigation policies can be constructed that maintain safety.
Adding controlled sensing methods, we show that these policies can also lower
measurement costs at the same time.
- Abstract(参考訳): おもちゃの航海環境を用いて,部分観察マルコフ決定過程(pomdp)に関する部分的情報のみを知っていれば,動的プログラミングが利用できることを示す。
モデルに不確実性を組み込むことで,安全を維持するためのナビゲーションポリシーを構築することができることを示す。
制御されたセンシング手法を加えることで,これらのポリシーは同時に測定コストを低減できることを示す。
関連論文リスト
- NaviHydra: Controllable Navigation-guided End-to-end Autonomous Driving with Hydra-distillation [6.722962084265695]
NaviHydraは、既存のルールベースのシミュレータから抽出した、制御可能なナビゲーションガイド付きエンドツーエンドモデルである。
本フレームワークは,高レベルナビゲーションコマンドを制御信号として受け入れ,特定の意図に整合した軌道を生成する。
論文 参考訳(メタデータ) (2025-12-11T14:05:18Z) - Unified Multimodal Vessel Trajectory Prediction with Explainable Navigation Intention [18.699213433572996]
船舶軌道予測は、インテリジェント海洋システムの基本である。
既存の船舶軌道予測手法は、限られたシナリオ適用性と説明性に乏しい。
本稿では,説明可能なナビゲーション意図を取り入れた統合型船舶軌道予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-18T08:56:30Z) - PIGEON: VLM-Driven Object Navigation via Points of Interest Selection [50.77437819030925]
視覚言語モデル(VLM)を用いたオブジェクトナビゲーションのための興味あるガイド探索点PIGEONを提案する。
我々は、PIGEON-VLと呼ばれる大規模な視覚言語モデル(VLM)を用いて、探索中に形成された関心のポイント(PoI)を選択し、次に低レベルのプランナーを用いて行動出力を行い、決定頻度を増大させる。
従来のオブジェクトナビゲーションベンチマークの実験では、我々のゼロショット転送方式は最先端のパフォーマンスを達成する一方、RLVRはモデルのセマンティックガイダンス機能をさらに強化し、リアルタイムナビゲーションにおける深い推論を可能にしている。
論文 参考訳(メタデータ) (2025-11-17T10:19:13Z) - Learning controllable dynamics through informative exploration [3.0846824529023387]
予測情報ゲイン(predicted information gain)と呼ばれる情報指標を用いて,次に探索する環境の最も情報性の高い地域を決定する。
強化学習からの手法の適用により、適切な準最適探索ポリシーを見つけることができる。
論文 参考訳(メタデータ) (2025-07-09T06:20:24Z) - DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.888688171010365]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。
我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-28T04:46:13Z) - Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文 参考訳(メタデータ) (2025-04-30T13:47:25Z) - Navigation World Models [68.58459393846461]
本稿では,過去の観測とナビゲーション行動に基づいて,将来の視覚観測を予測できる制御可能な映像生成モデルを提案する。
慣れ親しんだ環境では、NWMはナビゲーションの軌道をシミュレートし、目的を達成するかどうかを評価することで計画することができる。
実験は、スクラッチからの軌道計画や、外部ポリシーからサンプリングされた軌道のランク付けにおいて、その効果を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:59:45Z) - Hierarchical end-to-end autonomous navigation through few-shot waypoint detection [0.0]
人間のナビゲーションはランドマークと行動の関連によって促進される。
現在の自律ナビゲーション方式は、正確な位置決め装置とアルゴリズム、および環境から収集されたセンサーデータの広範なストリームに依存している。
本研究では,移動ロボットがこれまで知られていなかった環境をナビゲートできる階層型メタ学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-23T00:03:39Z) - Competency-Aware Planning for Probabilistically Safe Navigation Under Perception Uncertainty [0.10923877073891446]
知覚に基づくナビゲーションシステムは、複雑な地形における無人地上車両(UGV)のナビゲーションに有用である。
本研究では,確率的・再構成型能力推定法(PaRCE)を開発し,入力画像との親しみ度を推定する。
総合能力スコアは, 正しく分類され, 誤分類され, アウト・オブ・ディストリビューション (OOD) のサンプルを正確に予測できることがわかった。
論文 参考訳(メタデータ) (2024-09-09T23:34:24Z) - TAS: A Transit-Aware Strategy for Embodied Navigation with Non-Stationary Targets [55.09248760290918]
非定常目標を持つ動的シナリオにおけるナビゲーションのための新しいアルゴリズムを提案する。
我々の新しいTAS(Transit-Aware Strategy)は、具体化されたナビゲーションポリシーをオブジェクトパス情報で強化する。
TASは、ターゲットルートとルートを同期させるエージェントを報酬することで、非定常環境での性能を改善する。
論文 参考訳(メタデータ) (2024-03-14T22:33:22Z) - TINA: Think, Interaction, and Action Framework for Zero-Shot Vision Language Navigation [11.591176410027224]
本稿では,Large Language Models(LLM)に基づく視覚言語ナビゲーション(VLN)エージェントを提案する。
環境認識におけるLLMの欠点を補うための思考・相互作用・行動の枠組みを提案する。
また,本手法は教師付き学習手法よりも優れ,ゼロショットナビゲーションの有効性を強調した。
論文 参考訳(メタデータ) (2024-03-13T05:22:39Z) - A Bionic Data-driven Approach for Long-distance Underwater Navigation with Anomaly Resistance [59.21686775951903]
様々な動物が環境の手がかりを使って正確なナビゲーションをしている。
動物航法にインスパイアされたこの研究は、長距離水中航法のためのバイオニックでデータ駆動のアプローチを提案する。
提案手法では,GPSシステムや地理地図を必要とせず,測地データを用いてナビゲーションを行う。
論文 参考訳(メタデータ) (2024-02-06T13:20:56Z) - Learning to Predict Navigational Patterns from Partial Observations [63.04492958425066]
本稿では,実環境におけるナビゲーションのパターンを,部分的な観察のみから推測する,初めての自己教師型学習(SSL)手法を提案する。
我々は、DSLPフィールドに最大極大グラフを適合させることにより、グローバルなナビゲーションパターンを推論する方法を実証する。
実験により,我々のSSLモデルはnuScenesデータセット上で2つのSOTA教師付きレーングラフ予測モデルより優れていることが示された。
論文 参考訳(メタデータ) (2023-04-26T02:08:46Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Control Transformer: Robot Navigation in Unknown Environments through
PRM-Guided Return-Conditioned Sequence Modeling [0.0]
サンプルベース確率的ロードマッププランナによって導かれる低レベルポリシーから返却条件付きシーケンスをモデル化する制御変換器を提案する。
制御トランスフォーマーは迷路を通り、未知の環境へ移動できることを示す。
論文 参考訳(メタデータ) (2022-11-11T18:44:41Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - Uncertainty in Data-Driven Kalman Filtering for Partially Known
State-Space Models [84.18625250574853]
本稿では,ハイブリッドモデルに基づくディープステートトラッキングアルゴリズムであるKalmanNetを用いて,不確実性の評価を行う。
誤差共分散行列は内部特性に基づいて不確実性の測定値として計算可能であることを示す。
システムダイナミクスが分かっている場合、KalmanNetは統計情報にアクセスせずにデータからマッピングを学習し、Kalmanフィルタに類似した不確実性を示す。
論文 参考訳(メタデータ) (2021-10-10T08:52:18Z) - Enhancing Navigational Safety in Crowded Environments using
Semantic-Deep-Reinforcement-Learning-based Navigation [5.706538676509249]
本研究では,高レベルの障害物情報からオブジェクト固有の安全ルールを学習する意味的な深層強化学習に基づくナビゲーション手法を提案する。
エージェントは、個々の安全距離をセマンティック情報に依存することにより、より安全にナビゲートできることを実証する。
論文 参考訳(メタデータ) (2021-09-23T10:50:47Z) - Unsupervised Domain Adaptation for Visual Navigation [115.85181329193092]
視覚ナビゲーションのための教師なし領域適応手法を提案する。
本手法では,対象領域の画像をソース領域に変換し,ナビゲーションポリシで学習した表現と一致するようにする。
論文 参考訳(メタデータ) (2020-10-27T18:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。