Fugu-MT 論文翻訳(概要): Dynamic programming with partial information to overcome navigational uncertainty in a nautical environment

論文の概要: Dynamic programming with partial information to overcome navigational uncertainty in a nautical environment

arxiv url: http://arxiv.org/abs/2112.14657v1
Date: Wed, 29 Dec 2021 17:09:22 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-30 16:19:38.921931
Title: Dynamic programming with partial information to overcome navigational uncertainty in a nautical environment
Title（参考訳）: 海洋環境における航法不確実性克服のための部分情報を用いた動的プログラミング
Authors: Chris Beeler, Xinkai Li, Mark Crowley, Maia Fraser, Isaac Tamblyn
Abstract要約: 部分的に観察されたマルコフ決定過程に関する部分的な情報のみを知っていれば,動的プログラミングが利用できることを示す。モデルに不確実性を組み込むことで,安全を維持するためのナビゲーションポリシーを構築することができることを示す。
参考スコア（独自算出の注目度）: 1.805933123016726
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Using a toy nautical navigation environment, we show that dynamic programming can be used when only partial information about a partially observed Markov decision process (POMDP) is known. By incorporating uncertainty into our model, we show that navigation policies can be constructed that maintain safety. Adding controlled sensing methods, we show that these policies can also lower measurement costs at the same time.
Abstract（参考訳）: おもちゃの航海環境を用いて,部分観察マルコフ決定過程(pomdp)に関する部分的情報のみを知っていれば,動的プログラミングが利用できることを示す。モデルに不確実性を組み込むことで,安全を維持するためのナビゲーションポリシーを構築することができることを示す。制御されたセンシング手法を加えることで,これらのポリシーは同時に測定コストを低減できることを示す。

関連論文リスト

Learning controllable dynamics through informative exploration [3.0846824529023387]
予測情報ゲイン(predicted information gain)と呼ばれる情報指標を用いて,次に探索する環境の最も情報性の高い地域を決定する。強化学習からの手法の適用により、適切な準最適探索ポリシーを見つけることができる。
論文参考訳（メタデータ） (2025-07-09T06:20:24Z)
Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳（メタデータ） (2025-04-30T13:47:25Z)
Navigation World Models [68.58459393846461]
本稿では,過去の観測とナビゲーション行動に基づいて,将来の視覚観測を予測できる制御可能な映像生成モデルを提案する。慣れ親しんだ環境では、NWMはナビゲーションの軌道をシミュレートし、目的を達成するかどうかを評価することで計画することができる。実験は、スクラッチからの軌道計画や、外部ポリシーからサンプリングされた軌道のランク付けにおいて、その効果を実証する。
論文参考訳（メタデータ） (2024-12-04T18:59:45Z)
Hierarchical end-to-end autonomous navigation through few-shot waypoint detection [0.0]
人間のナビゲーションはランドマークと行動の関連によって促進される。現在の自律ナビゲーション方式は、正確な位置決め装置とアルゴリズム、および環境から収集されたセンサーデータの広範なストリームに依存している。本研究では,移動ロボットがこれまで知られていなかった環境をナビゲートできる階層型メタ学習手法を提案する。
論文参考訳（メタデータ） (2024-09-23T00:03:39Z)
Competency-Aware Planning for Probabilistically Safe Navigation Under Perception Uncertainty [0.10923877073891446]
知覚に基づくナビゲーションシステムは、複雑な地形における無人地上車両(UGV)のナビゲーションに有用である。本研究では,確率的・再構成型能力推定法(PaRCE)を開発し,入力画像との親しみ度を推定する。総合能力スコアは, 正しく分類され, 誤分類され, アウト・オブ・ディストリビューション (OOD) のサンプルを正確に予測できることがわかった。
論文参考訳（メタデータ） (2024-09-09T23:34:24Z)
TINA: Think, Interaction, and Action Framework for Zero-Shot Vision Language Navigation [11.591176410027224]
本稿では,Large Language Models(LLM)に基づく視覚言語ナビゲーション(VLN)エージェントを提案する。環境認識におけるLLMの欠点を補うための思考・相互作用・行動の枠組みを提案する。また,本手法は教師付き学習手法よりも優れ,ゼロショットナビゲーションの有効性を強調した。
論文参考訳（メタデータ） (2024-03-13T05:22:39Z)
A Bionic Data-driven Approach for Long-distance Underwater Navigation with Anomaly Resistance [59.21686775951903]
様々な動物が環境の手がかりを使って正確なナビゲーションをしている。動物航法にインスパイアされたこの研究は、長距離水中航法のためのバイオニックでデータ駆動のアプローチを提案する。提案手法では,GPSシステムや地理地図を必要とせず,測地データを用いてナビゲーションを行う。
論文参考訳（メタデータ） (2024-02-06T13:20:56Z)
Learning to Predict Navigational Patterns from Partial Observations [63.04492958425066]
本稿では,実環境におけるナビゲーションのパターンを,部分的な観察のみから推測する,初めての自己教師型学習(SSL)手法を提案する。我々は、DSLPフィールドに最大極大グラフを適合させることにより、グローバルなナビゲーションパターンを推論する方法を実証する。実験により,我々のSSLモデルはnuScenesデータセット上で2つのSOTA教師付きレーングラフ予測モデルより優れていることが示された。
論文参考訳（メタデータ） (2023-04-26T02:08:46Z)
In-Distribution Barrier Functions: Self-Supervised Policy Filters that Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文参考訳（メタデータ） (2023-01-27T22:28:19Z)
Control Transformer: Robot Navigation in Unknown Environments through PRM-Guided Return-Conditioned Sequence Modeling [0.0]
サンプルベース確率的ロードマッププランナによって導かれる低レベルポリシーから返却条件付きシーケンスをモデル化する制御変換器を提案する。制御トランスフォーマーは迷路を通り、未知の環境へ移動できることを示す。
論文参考訳（メタデータ） (2022-11-11T18:44:41Z)
Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。価値に基づく政策段階の深層強化学習(DRL)について考察する。また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文参考訳（メタデータ） (2021-12-16T16:53:56Z)
Uncertainty in Data-Driven Kalman Filtering for Partially Known State-Space Models [84.18625250574853]
本稿では,ハイブリッドモデルに基づくディープステートトラッキングアルゴリズムであるKalmanNetを用いて,不確実性の評価を行う。誤差共分散行列は内部特性に基づいて不確実性の測定値として計算可能であることを示す。システムダイナミクスが分かっている場合、KalmanNetは統計情報にアクセスせずにデータからマッピングを学習し、Kalmanフィルタに類似した不確実性を示す。
論文参考訳（メタデータ） (2021-10-10T08:52:18Z)
Enhancing Navigational Safety in Crowded Environments using Semantic-Deep-Reinforcement-Learning-based Navigation [5.706538676509249]
本研究では,高レベルの障害物情報からオブジェクト固有の安全ルールを学習する意味的な深層強化学習に基づくナビゲーション手法を提案する。エージェントは、個々の安全距離をセマンティック情報に依存することにより、より安全にナビゲートできることを実証する。
論文参考訳（メタデータ） (2021-09-23T10:50:47Z)
Unsupervised Domain Adaptation for Visual Navigation [115.85181329193092]
視覚ナビゲーションのための教師なし領域適応手法を提案する。本手法では,対象領域の画像をソース領域に変換し,ナビゲーションポリシで学習した表現と一致するようにする。
論文参考訳（メタデータ） (2020-10-27T18:22:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。