論文の概要: RISE: Robust Individualized Decision Learning with Sensitive Variables
- arxiv url: http://arxiv.org/abs/2211.06569v1
- Date: Sat, 12 Nov 2022 04:31:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 17:03:38.230758
- Title: RISE: Robust Individualized Decision Learning with Sensitive Variables
- Title(参考訳): RISE: 敏感な変数を用いたロバスト個別決定学習
- Authors: Xiaoqing Tan, Zhengling Qi, Christopher W. Seymour, Lu Tang
- Abstract要約: 素直なベースラインは、決定規則を学習する際の繊細な変数を無視し、重大な不確実性と偏見をもたらすことである。
本稿では、オフライントレーニング中に機密変数を組み込む決定学習フレームワークを提案するが、モデル展開中に学習された決定ルールの入力には含まない。
- 参考スコア(独自算出の注目度): 1.5293427903448025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces RISE, a robust individualized decision learning
framework with sensitive variables, where sensitive variables are collectible
data and important to the intervention decision, but their inclusion in
decision making is prohibited due to reasons such as delayed availability or
fairness concerns. A naive baseline is to ignore these sensitive variables in
learning decision rules, leading to significant uncertainty and bias. To
address this, we propose a decision learning framework to incorporate sensitive
variables during offline training but not include them in the input of the
learned decision rule during model deployment. Specifically, from a causal
perspective, the proposed framework intends to improve the worst-case outcomes
of individuals caused by sensitive variables that are unavailable at the time
of decision. Unlike most existing literature that uses mean-optimal objectives,
we propose a robust learning framework by finding a newly defined quantile- or
infimum-optimal decision rule. The reliable performance of the proposed method
is demonstrated through synthetic experiments and three real-world
applications.
- Abstract(参考訳): 本稿では,センシティブな変数が収集可能なデータであり,介入決定に重要である,敏感な変数を持つ,堅牢な個別化決定学習フレームワークであるriseを紹介する。
ナイーブなベースラインは、決定ルールの学習においてこれらのセンシティブな変数を無視することであり、重大な不確実性とバイアスをもたらす。
そこで本研究では,オフライントレーニング中にセンシティブな変数を取り入れつつ,モデル展開時に学習した決定ルールの入力に含めない決定学習フレームワークを提案する。
具体的には、因果的観点からは、決定時に利用できない敏感な変数によって引き起こされる個人の最悪の結果を改善することを目的としている。
平均最適目的を用いた既存の文献と異なり、新しく定義された分位または不フィムの最適決定規則を見つけることによって、堅牢な学習フレームワークを提案する。
提案手法の信頼性は, 合成実験と実世界の3つの応用により実証された。
関連論文リスト
- On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - Explainability's Gain is Optimality's Loss? -- How Explanations Bias
Decision-making [0.0]
説明は、アルゴリズムと人間の意思決定者とのコミュニケーションを促進するのに役立つ。
因果モデルに関する特徴に基づく説明のセマンティクスは、意思決定者の以前の信念から漏れを引き起こす。
このような違いは、準最適かつ偏った決定結果をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-06-17T11:43:42Z) - Limitations of a proposed correction for slow drifts in decision
criterion [0.0]
ランダムドリフトからの系統的な更新を曖昧にするためのモデルに基づくアプローチを提案する。
提案手法は,決定基準におけるドリフトの潜航軌跡を正確に回復することを示す。
本結果は,生成過程の仮定を直接意思決定モデルに組み込むことの利点を強調した。
論文 参考訳(メタデータ) (2022-05-22T19:33:19Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - The Statistical Complexity of Interactive Decision Making [126.04974881555094]
複雑度尺度であるDecision-Estimation Coefficientは,サンプル効率のインタラクティブ学習に必要かつ十分であることが証明された。
統合アルゴリズム設計原則であるE2Dは、教師付き推定のための任意のアルゴリズムを、意思決定のためのオンラインアルゴリズムに変換する。
論文 参考訳(メタデータ) (2021-12-27T02:53:44Z) - Learning Pareto-Efficient Decisions with Confidence [21.915057426589748]
本稿では,結果が不確実な場合の多目的意思決定支援の問題点について考察する。
これにより、安全クリティカルなアプリケーションに関係のある末尾的な結果の観点から、意思決定間のトレードオフを定量化できます。
論文 参考訳(メタデータ) (2021-10-19T11:32:17Z) - Modularity in Reinforcement Learning via Algorithmic Independence in
Credit Assignment [79.5678820246642]
提案手法は, 事前決定の順序に対して, スパース変化のみを必要とする伝達問題に対して, 政策段階の手法よりも, より標本効率が高いことを示す。
我々は最近提案された社会的意思決定の枠組みをマルコフ決定プロセスよりもよりきめ細かい形式主義として一般化する。
論文 参考訳(メタデータ) (2021-06-28T21:29:13Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z) - Effective Reinforcement Learning through Evolutionary Surrogate-Assisted
Prescription [18.547387505708485]
本稿では、進化的サロゲート支援処方(ESP)と呼ばれる一般的なアプローチを紹介する。
ESPは現実世界の問題における決定の最適化のための有望な基盤を形成する。
論文 参考訳(メタデータ) (2020-02-13T06:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。