論文の概要: Cooperative Trajectory Planning in Uncertain Environments with Monte
Carlo Tree Search and Risk Metrics
- arxiv url: http://arxiv.org/abs/2203.04452v1
- Date: Wed, 9 Mar 2022 00:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 17:05:15.609591
- Title: Cooperative Trajectory Planning in Uncertain Environments with Monte
Carlo Tree Search and Risk Metrics
- Title(参考訳): モンテカルロ木探索とリスク指標を用いた不確定環境における協調軌道計画
- Authors: Philipp Stegmaier, Karl Kurzer, J. Marius Z\"ollner
- Abstract要約: 連続行動空間に対するモンテカルロ木探索に基づく既存の協調軌道計画手法を拡張した。
ルート信念状態の形で不確実性を明示的にモデル化し、そこから木の開始状態がサンプリングされる。
最終選択政策におけるリスクメトリクスの統合は、不確実な環境でのベースラインを一貫して上回ることを示すことができる。
- 参考スコア(独自算出の注目度): 2.658812114255374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated vehicles require the ability to cooperate with humans for a smooth
integration into today's traffic. While the concept of cooperation is well
known, the development of a robust and efficient cooperative trajectory
planning method is still a challenge. One aspect of this challenge is the
uncertainty surrounding the state of the environment due to limited sensor
accuracy. This uncertainty can be represented by a Partially Observable Markov
Decision Process. Our work addresses this problem by extending an existing
cooperative trajectory planning approach based on Monte Carlo Tree Search for
continuous action spaces. It does so by explicitly modeling uncertainties in
the form of a root belief state, from which start states for trees are sampled.
After the trees have been constructed with Monte Carlo Tree Search, their
results are aggregated into return distributions using kernel regression. For
the final selection, we apply two risk metrics, namely a Lower Confidence Bound
and a Conditional Value at Risk. It can be demonstrated that the integration of
risk metrics in the final selection policy consistently outperforms a baseline
in uncertain environments, generating considerably safer trajectories.
- Abstract(参考訳): 自動走行車は、今日の交通にスムーズに統合するために、人間と協力する能力を必要とする。
協調の概念はよく知られているが、堅牢で効率的な協調軌道計画法の開発は依然として課題である。
この課題の1つの側面は、センサーの精度が制限されているため、環境の状態を囲む不確実性である。
この不確実性は、部分的に観測可能なマルコフ決定プロセスによって表される。
本研究は,モンテカルロ木探索に基づく協調軌道計画手法を連続行動空間に拡張することにより,この問題に対処する。
ルート信念状態の形で不確実性を明示的にモデル化し、そこから木の開始状態がサンプリングされる。
木がモンテカルロ木探索で構築された後、その結果はカーネル回帰を用いて返却分布に集約される。
最終選択には,信頼性の低下とリスク条件値の2つのリスク指標を適用する。
最終選択政策におけるリスクメトリクスの統合は、不確実な環境におけるベースラインを一貫して上回り、より安全な軌道を生成することが証明できる。
関連論文リスト
- Anytime Probabilistically Constrained Provably Convergent Online Belief Space Planning [7.081396107231381]
連続領域におけるモンテカルロ木探索法 (MCTS) を用いた随時アプローチを提案する。
我々はアルゴリズムのバージョンの指数率で確率収束を証明し、広範囲なシミュレーションを通して提案手法を検証した。
論文 参考訳(メタデータ) (2024-11-11T04:42:18Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Optimizing Agricultural Order Fulfillment Systems: A Hybrid Tree Search Approach [1.1470070927586018]
効率的なオーダーフルフィルメントは、特に種子サプライチェーンの季節的性質のため、農業において不可欠である。
本稿では, 受注を波動で処理する集中型倉庫において, 種子の受注を最適化する課題について述べる。
モンテカルロ木探索とドメイン固有知識を組み合わせた適応型ハイブリッド木探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-19T01:25:39Z) - Cooperative Probabilistic Trajectory Forecasting under Occlusion [110.4960878651584]
隠蔽対象の情報を安全なナビゲーションのためにエゴエージェントに伝達する必要がある場合が多い。
本稿では,エゴエージェントの基準フレームにおける閉塞歩行者の現況を協調的に推定するエンド・ツー・エンドネットワークを設計する。
また,エゴ剤による閉塞歩行者の不確実性を考慮した軌道予測は,閉塞を前提とした地上の真実軌道とほぼ同様であることを示した。
論文 参考訳(メタデータ) (2023-12-06T05:36:52Z) - Monte Carlo Planning in Hybrid Belief POMDPs [7.928094304325113]
我々は,モンテカルロ木探索 (MCTS) アルゴリズムを用いてPOMDPを解くハイブリッドリーフモンテカルロ計画 (HB-MCP) を提案する。
仮説樹の成長を誘導するために, 上位信頼度(UCB)探索ボーナスをいかに活用できるかを示す。
そして、未解決のデータアソシエーションがマルチモーダルな信念の仮説に繋がる、高度にエイリアス化されたシミュレーション環境で、我々のアプローチを評価する。
論文 参考訳(メタデータ) (2022-11-14T20:16:51Z) - Continuous Monte Carlo Graph Search [61.11769232283621]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンラインプランニングへの拡張である。
CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。
並列化によってスケールアップすることができ、学習力学モデルによる連続制御においてクロスエントロピー法(CEM)よりも優れている。
論文 参考訳(メタデータ) (2022-10-04T07:34:06Z) - Case Studies for Computing Density of Reachable States for Safe
Autonomous Motion Planning [8.220217498103313]
到達可能な状態の密度は、安全クリティカルなシステムのリスクを理解するのに役立つ。
最近の研究は、自律システムの前方到達可能な状態の密度分布をオンラインで計算するためのデータ駆動型アプローチを提供する。
本稿では,不確実性を考慮した安全な経路計画のためのモデル予測制御とモデル予測制御の併用について検討する。
論文 参考訳(メタデータ) (2022-09-16T17:38:24Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Latent Bandits Revisited [55.88616813182679]
潜伏盗賊問題は、学習エージェントが未知の離散潜伏状態に条件付けられた腕の報酬分布を知知する問題である。
本稿では, 上位信頼境界(UCB)とトンプソンサンプリング(Thompson sample)の両方に基づいて, この設定のための一般的なアルゴリズムを提案する。
我々はアルゴリズムの統一的な理論的解析を行い、遅延状態の数がアクションよりも小さい場合、古典的なバンディットポリシーよりも後悔度が低い。
論文 参考訳(メタデータ) (2020-06-15T19:24:02Z) - Safe Mission Planning under Dynamical Uncertainties [15.533842336139063]
本稿では,不確実な動環境下での安全なロボットミッション計画について考察する。
動的不確実性のモデリングと統合が安全な計画フレームワークに組み込まれているため、これは難しい問題である。
論文 参考訳(メタデータ) (2020-03-05T20:45:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。