論文の概要: Risk Awareness in HTN Planning
- arxiv url: http://arxiv.org/abs/2204.10669v1
- Date: Fri, 22 Apr 2022 12:33:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-25 13:50:30.503312
- Title: Risk Awareness in HTN Planning
- Title(参考訳): HTN計画におけるリスク意識
- Authors: Ebaa Alnazer, Ilche Georgievski, Marco Aiello
- Abstract要約: 実際の現実世界のドメインは、リソースの行動と利用がリスクを受け入れる必要がある不確実な状況によって特徴づけられる。
階層型タスクネットワーク(HTN)計画を現実世界のアプリケーションで広く使われている計画手法として捉え、既存のアプローチがリスクを考慮していないことを観察することができる。
本稿では,行動コストの確率分布を用いてリスクと不確実性をモデル化するHTN計画の一般的な枠組みを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Actual real-world domains are characterised by uncertain situations in which
acting and use of resources require embracing risk. Performing actions in such
domains always entails costs of consuming some resource, such as time, money,
or energy, where the knowledge about these costs can range from totally known
to totally unknown and even unknowable probabilities of costs. Think of robotic
domains, where actions and their costs are non-deterministic due to uncertain
factors like obstacles. Choosing which action to perform considering its cost
on the available resource requires taking a stance on risk. Thus, these domains
call for not only planning under uncertainty but also planning while embracing
risk. Taking Hierarchical Task Network (HTN) planning as a widely used planning
technique in real-world applications, one can observe that existing approaches
do not account for risk. That is, computing most probable or optimal plans
using actions with single-valued costs is only enough to express risk
neutrality. In this work, we postulate that HTN planning can become risk aware
by considering expected utility theory, a representative concept of decision
theory that enables choosing actions considering a probability distribution of
their costs and a given risk attitude expressed using a utility function. In
particular, we introduce a general framework for HTN planning that allows
modelling risk and uncertainty using a probability distribution of action costs
upon which we define risk-aware HTN planning as an approach that accounts for
the different risk attitudes and allows computing plans that go beyond risk
neutrality. In fact, we layout that computing risk-aware plans requires finding
plans with the highest expected utility. Finally, we argue that it is possible
for HTN planning agents to solve specialised risk-aware HTN planning problems
by adapting some existing HTN planning approaches.
- Abstract(参考訳): 実際の現実世界のドメインは、リソースの動作と使用がリスクを受け入れる必要がある不確定な状況によって特徴づけられる。
このような領域における行動の実行には、時間、お金、エネルギーなどのリソースを消費するコストが常に必要であり、そこでは、これらのコストに関する知識は、完全に未知のものから全く知られていないもの、さらにはコストの予測不可能なものまで様々である。
障害のような不確実な要因のために、アクションとそのコストが決定論的でないロボットドメインを考えてみてください。
利用可能なリソースのコストを考慮して実行すべきアクションを選択するには、リスクに対するスタンスを取る必要がある。
したがって、これらのドメインは不確実性の下で計画するだけでなく、リスクを受け入れながら計画することを求める。
階層型タスクネットワーク(HTN)計画を現実世界のアプリケーションで広く使われている計画手法として捉え、既存のアプローチがリスクを考慮していないことを観察することができる。
すなわち、単一コストのアクションを使用して最も確率的または最適な計画を計算することは、リスク中立性を表現するのに十分である。
本研究では,HTN計画が予測ユーティリティ理論,コストの確率分布を考慮した行動選択を可能にする決定理論の代表的な概念,ユーティリティ関数を用いて表現されたリスク態度を考慮し,リスクを意識することができることを仮定する。
特に,リスクを意識したHTN計画を,リスク中立性を超えた計算計画を可能にするアプローチとして定義する,行動コストの確率分布を用いたリスクと不確実性をモデル化するHTN計画の一般的な枠組みを紹介する。
実際、我々はリスクを意識した計画を立てるには、最も期待されるユーティリティーで計画を見つける必要がある。
最後に,HTN計画エージェントは,既存のHTN計画手法を適応させることで,リスクを意識したHTN計画問題の解決が可能であることを論じる。
関連論文リスト
- Risks and NLP Design: A Case Study on Procedural Document QA [52.557503571760215]
より具体的なアプリケーションやユーザに対して分析を専門化すれば,ユーザに対するリスクや害の明確な評価が可能になる,と我々は主張する。
リスク指向のエラー分析を行い、リスクの低減とパフォーマンスの向上を図り、将来のシステムの設計を通知する。
論文 参考訳(メタデータ) (2024-08-16T17:23:43Z) - Partially Observable Task and Motion Planning with Uncertainty and Risk Awareness [34.77182116081535]
統合型タスク・アンド・モーション・プランニング(TAMP)は、長期のロボット操作とナビゲーションの問題を一般化するための貴重なアプローチであることが証明されている。
これらの仮定は、プランナーが情報を収集し、リスクを認識した意思決定を行う能力を制限します。
本研究では,初期状態と行動結果の不確実性を伴う長期計画問題を効果的に解決できる不確実性とリスク認識(TAMPURA)を備えたTAMP戦略を提案する。
論文 参考訳(メタデータ) (2024-03-15T16:42:14Z) - Capsa: A Unified Framework for Quantifying Risk in Deep Neural Networks [142.67349734180445]
ディープニューラルネットワークにリスク認識を提供する既存のアルゴリズムは複雑でアドホックである。
ここでは、リスク認識でモデルを拡張するためのフレームワークであるcapsaを紹介します。
論文 参考訳(メタデータ) (2023-08-01T02:07:47Z) - Adaptive Risk-Aware Bidding with Budget Constraint in Display
Advertising [47.14651340748015]
本稿では,強化学習による予算制約を考慮した適応型リスク対応入札アルゴリズムを提案する。
リスク・アット・バリュー(VaR)に基づく不確実性とリスク傾向の本質的関係を理論的に明らかにする。
論文 参考訳(メタデータ) (2022-12-06T18:50:09Z) - RAP: Risk-Aware Prediction for Robust Planning [21.83865866611308]
軌道上のリスクバイアス分布を学習するための新しい予測手法を提案する。
これにより、オンライン計画中のリスク推定のサンプルの複雑さが軽減される。
論文 参考訳(メタデータ) (2022-10-04T04:19:15Z) - Planning with Dynamically Estimated Action Costs [2.8326418377665346]
実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。
近年のアプローチでは、データからしばしば学習されるブラックボックス外部アクションコスト推定器が計画段階で適用されている。
本稿では,行動コストを考慮した決定論的計画の一般化を提案する。
論文 参考訳(メタデータ) (2022-06-08T21:10:37Z) - A Survey of Risk-Aware Multi-Armed Bandits [84.67376599822569]
我々は、様々な利害リスク対策をレビューし、その特性についてコメントする。
我々は,探索と探索のトレードオフが現れる,後悔の最小化設定のためのアルゴリズムを検討する。
今後の研究の課題と肥大化についてコメントし、締めくくりに締めくくります。
論文 参考訳(メタデータ) (2022-05-12T02:20:34Z) - Efficient Risk-Averse Reinforcement Learning [79.61412643761034]
リスク逆強化学習(RL)では、リターンのリスク測定を最適化することが目標である。
特定の条件下では、これは必然的に局所最適障壁につながることを証明し、それを回避するためのソフトリスク機構を提案する。
迷路ナビゲーション,自律運転,資源配分ベンチマークにおいて,リスク回避の改善を示す。
論文 参考訳(メタデータ) (2022-05-10T19:40:52Z) - Risk Conditioned Neural Motion Planning [14.018786843419862]
リスクバウンド・モーション・プランニングは、安全クリティカルなタスクにとって重要な問題であるが難しい問題である。
本稿では,リスク評論家による計画の実行リスクを推定するために,ソフトアクター批評家モデルの拡張を提案する。
計算時間と計画品質の両面で,我々のモデルの利点を示す。
論文 参考訳(メタデータ) (2021-08-04T05:33:52Z) - Risk-Averse Stochastic Shortest Path Planning [25.987787625028204]
最適、定常、マルコフの方針が存在することを示し、特別なベルマン方程式を用いて見出すことができる。
ローバーナビゲーションMDPを用いて,条件値値リスク(CVaR)とエントロピー値値リスク(EVaR)のコヒーレントリスク尺度を用いて提案手法を説明する。
論文 参考訳(メタデータ) (2021-03-26T20:49:14Z) - Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff
in Regret [115.85354306623368]
本研究では,未知の遷移カーネルを持つマルコフ決定過程におけるリスク感応性強化学習について検討する。
確率的に効率的なモデルレスアルゴリズムとして、リスク感性価値反復(RSVI)とリスク感性Q-ラーニング(RSQ)を提案する。
RSVIが $tildeObig(lambda(|beta| H2) cdot sqrtH3 S2AT big) に達したことを証明しています。
論文 参考訳(メタデータ) (2020-06-22T19:28:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。