論文の概要: Dynamic programming with partial information to overcome navigational
uncertainty in a nautical environment
- arxiv url: http://arxiv.org/abs/2112.14657v1
- Date: Wed, 29 Dec 2021 17:09:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-30 16:19:38.921931
- Title: Dynamic programming with partial information to overcome navigational
uncertainty in a nautical environment
- Title(参考訳): 海洋環境における航法不確実性克服のための部分情報を用いた動的プログラミング
- Authors: Chris Beeler, Xinkai Li, Mark Crowley, Maia Fraser, Isaac Tamblyn
- Abstract要約: 部分的に観察されたマルコフ決定過程に関する部分的な情報のみを知っていれば,動的プログラミングが利用できることを示す。
モデルに不確実性を組み込むことで,安全を維持するためのナビゲーションポリシーを構築することができることを示す。
- 参考スコア(独自算出の注目度): 1.805933123016726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using a toy nautical navigation environment, we show that dynamic programming
can be used when only partial information about a partially observed Markov
decision process (POMDP) is known. By incorporating uncertainty into our model,
we show that navigation policies can be constructed that maintain safety.
Adding controlled sensing methods, we show that these policies can also lower
measurement costs at the same time.
- Abstract(参考訳): おもちゃの航海環境を用いて,部分観察マルコフ決定過程(pomdp)に関する部分的情報のみを知っていれば,動的プログラミングが利用できることを示す。
モデルに不確実性を組み込むことで,安全を維持するためのナビゲーションポリシーを構築することができることを示す。
制御されたセンシング手法を加えることで,これらのポリシーは同時に測定コストを低減できることを示す。
関連論文リスト
- TINA: Think, Interaction, and Action Framework for Zero-Shot Vision Language Navigation [11.591176410027224]
本稿では,Large Language Models(LLM)に基づく視覚言語ナビゲーション(VLN)エージェントを提案する。
環境認識におけるLLMの欠点を補うための思考・相互作用・行動の枠組みを提案する。
また,本手法は教師付き学習手法よりも優れ,ゼロショットナビゲーションの有効性を強調した。
論文 参考訳(メタデータ) (2024-03-13T05:22:39Z) - Learning to Predict Navigational Patterns from Partial Observations [63.04492958425066]
本稿では,実環境におけるナビゲーションのパターンを,部分的な観察のみから推測する,初めての自己教師型学習(SSL)手法を提案する。
我々は、DSLPフィールドに最大極大グラフを適合させることにより、グローバルなナビゲーションパターンを推論する方法を実証する。
実験により,我々のSSLモデルはnuScenesデータセット上で2つのSOTA教師付きレーングラフ予測モデルより優れていることが示された。
論文 参考訳(メタデータ) (2023-04-26T02:08:46Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Control Transformer: Robot Navigation in Unknown Environments through
PRM-Guided Return-Conditioned Sequence Modeling [0.0]
サンプルベース確率的ロードマッププランナによって導かれる低レベルポリシーから返却条件付きシーケンスをモデル化する制御変換器を提案する。
制御トランスフォーマーは迷路を通り、未知の環境へ移動できることを示す。
論文 参考訳(メタデータ) (2022-11-11T18:44:41Z) - Safe Output Feedback Motion Planning from Images via Learned Perception
Modules and Contraction Theory [6.950510860295866]
本稿では、実行時の安全性と目標到達性を保証する不確実な制御-アフィン非線形システムのクラスを示す。
我々は、観測から状態のサブセットを逆転させようとする知覚システムを訓練し、知覚誤差の上限を推定する。
次に、収縮理論を用いて安定化状態フィードバックコントローラと収束状態オブザーバを設計する。
この制御器が動的および不正確な状態推定における誤差を受ける場合、軌道追従誤差を導出する。
論文 参考訳(メタデータ) (2022-06-14T02:03:27Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - Uncertainty in Data-Driven Kalman Filtering for Partially Known
State-Space Models [84.18625250574853]
本稿では,ハイブリッドモデルに基づくディープステートトラッキングアルゴリズムであるKalmanNetを用いて,不確実性の評価を行う。
誤差共分散行列は内部特性に基づいて不確実性の測定値として計算可能であることを示す。
システムダイナミクスが分かっている場合、KalmanNetは統計情報にアクセスせずにデータからマッピングを学習し、Kalmanフィルタに類似した不確実性を示す。
論文 参考訳(メタデータ) (2021-10-10T08:52:18Z) - Enhancing Navigational Safety in Crowded Environments using
Semantic-Deep-Reinforcement-Learning-based Navigation [5.706538676509249]
本研究では,高レベルの障害物情報からオブジェクト固有の安全ルールを学習する意味的な深層強化学習に基づくナビゲーション手法を提案する。
エージェントは、個々の安全距離をセマンティック情報に依存することにより、より安全にナビゲートできることを実証する。
論文 参考訳(メタデータ) (2021-09-23T10:50:47Z) - Active Learning in Gaussian Process State Space Model [21.520328063169078]
ガウス過程状態空間モデル(GPSSM)におけるアクティブラーニングの検討
我々の問題は、入力を決定することによって、潜伏状態を通じて積極的にシステムを操ることである。
特に、潜伏状態が与えられたGPSSMに対して、相互情報の近似を行うための2つのアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-30T16:52:38Z) - Unsupervised Domain Adaptation for Visual Navigation [115.85181329193092]
視覚ナビゲーションのための教師なし領域適応手法を提案する。
本手法では,対象領域の画像をソース領域に変換し,ナビゲーションポリシで学習した表現と一致するようにする。
論文 参考訳(メタデータ) (2020-10-27T18:22:43Z) - Evaluating the Safety of Deep Reinforcement Learning Models using
Semi-Formal Verification [81.32981236437395]
本稿では,区間分析に基づく半形式的意思決定手法を提案する。
本手法は, 標準ベンチマークに比較して, 形式検証に対して比較結果を得る。
提案手法は, 意思決定モデルにおける安全性特性を効果的に評価することを可能にする。
論文 参考訳(メタデータ) (2020-10-19T11:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。