論文の概要: Learning Pareto-Efficient Decisions with Confidence
- arxiv url: http://arxiv.org/abs/2110.09864v1
- Date: Tue, 19 Oct 2021 11:32:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-20 13:12:24.239838
- Title: Learning Pareto-Efficient Decisions with Confidence
- Title(参考訳): 信頼によるパレート効率の良い意思決定の学習
- Authors: Sofia Ek, Dave Zachariah, Petre Stoica
- Abstract要約: 本稿では,結果が不確実な場合の多目的意思決定支援の問題点について考察する。
これにより、安全クリティカルなアプリケーションに関係のある末尾的な結果の観点から、意思決定間のトレードオフを定量化できます。
- 参考スコア(独自算出の注目度): 21.915057426589748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper considers the problem of multi-objective decision support when
outcomes are uncertain. We extend the concept of Pareto-efficient decisions to
take into account the uncertainty of decision outcomes across varying contexts.
This enables quantifying trade-offs between decisions in terms of tail outcomes
that are relevant in safety-critical applications. We propose a method for
learning efficient decisions with statistical confidence, building on results
from the conformal prediction literature. The method adapts to weak or
nonexistent context covariate overlap and its statistical guarantees are
evaluated using both synthetic and real data.
- Abstract(参考訳): 本稿では,結果が不確実な場合の多目的意思決定支援の問題について考察する。
我々は,パレート効率の高い意思決定の概念を拡張し,様々な文脈における意思決定結果の不確実性を考慮する。
これにより、安全クリティカルなアプリケーションに関連するテール結果の観点から、意思決定間のトレードオフを定量化することができる。
本稿では,コンフォーメーショナル予測文献から得られた結果をもとに,統計的自信を持って効率的な意思決定を行う手法を提案する。
弱もしくは非存在の文脈共変重なりに適応し、その統計的保証を合成データと実データの両方を用いて評価する。
関連論文リスト
- Measuring Classification Decision Certainty and Doubt [61.13511467941388]
複数分類決定機械学習問題における予測の品質と不確実性を評価し,比較するため,直感的なスコアを提案する。
論文 参考訳(メタデータ) (2023-03-25T21:31:41Z) - Multi-Target Decision Making under Conditions of Severe Uncertainty [0.0]
不完全な優先的・確率的な情報をいかに利用して、異なる目標間の意思決定を比較するかを示す。
本稿では,提案する決定オプション間の順序の興味深い性質について論じ,線形最適化によって具体的な計算方法を示す。
本論文は,アルゴリズムを異なる性能尺度で比較する文脈において,我々のフレームワークを実証することによって,論文を締めくくっている。
論文 参考訳(メタデータ) (2022-12-13T11:47:02Z) - Model-Free Reinforcement Learning with the Decision-Estimation
Coefficient [79.30248422988409]
本稿では,汎用関数近似による構造化帯域と強化学習を包含する対話型意思決定の課題について考察する。
提案手法は,値関数近似を用いたモデル自由強化学習における残差を導出し,より一般的には有効かつ不可能な構造的結果を与える。
論文 参考訳(メタデータ) (2022-11-25T17:29:40Z) - RISE: Robust Individualized Decision Learning with Sensitive Variables [1.5293427903448025]
素直なベースラインは、決定規則を学習する際の繊細な変数を無視し、重大な不確実性と偏見をもたらすことである。
本稿では、オフライントレーニング中に機密変数を組み込む決定学習フレームワークを提案するが、モデル展開中に学習された決定ルールの入力には含まない。
論文 参考訳(メタデータ) (2022-11-12T04:31:38Z) - On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - Explainability's Gain is Optimality's Loss? -- How Explanations Bias
Decision-making [0.0]
説明は、アルゴリズムと人間の意思決定者とのコミュニケーションを促進するのに役立つ。
因果モデルに関する特徴に基づく説明のセマンティクスは、意思決定者の以前の信念から漏れを引き起こす。
このような違いは、準最適かつ偏った決定結果をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-06-17T11:43:42Z) - The Statistical Complexity of Interactive Decision Making [126.04974881555094]
複雑度尺度であるDecision-Estimation Coefficientは,サンプル効率のインタラクティブ学習に必要かつ十分であることが証明された。
統合アルゴリズム設計原則であるE2Dは、教師付き推定のための任意のアルゴリズムを、意思決定のためのオンラインアルゴリズムに変換する。
論文 参考訳(メタデータ) (2021-12-27T02:53:44Z) - Reliable Off-policy Evaluation for Reinforcement Learning [53.486680020852724]
シーケンシャルな意思決定問題において、非政治評価は、目標政策の期待累積報酬を推定する。
本稿では、1つまたは複数のログデータを用いて、ロバストで楽観的な累積報酬推定を提供する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-08T23:16:19Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z) - Learning Robust Decision Policies from Observational Data [21.05564340986074]
高いコストで成果のリスクを減らすような堅牢な政策を学ぶことは、興味深いことです。
本研究では,特定のレベルでのコスト分布のテールを削減するための政策学習手法を開発した。
論文 参考訳(メタデータ) (2020-06-03T16:02:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。