論文の概要: Cost-Adaptive Recourse Recommendation by Adaptive Preference Elicitation
- arxiv url: http://arxiv.org/abs/2402.15073v1
- Date: Fri, 23 Feb 2024 03:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 15:50:39.218679
- Title: Cost-Adaptive Recourse Recommendation by Adaptive Preference Elicitation
- Title(参考訳): Adaptive Preference Elicitation によるコスト適応型レコメンデーション
- Authors: Duy Nguyen, Bao Nguyen, Viet Anh Nguyen
- Abstract要約: アルゴリズムのリコースでは、被験者に対して、好ましくない機械学習の分類決定を逆転させるために、コスト効率のよいアクションを推奨する。
本稿では、リコース生成問題に嗜好学習を統合するための2段階のアプローチを提案する。
- 参考スコア(独自算出の注目度): 18.423687983628145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Algorithmic recourse recommends a cost-efficient action to a subject to
reverse an unfavorable machine learning classification decision. Most existing
methods in the literature generate recourse under the assumption of complete
knowledge about the cost function. In real-world practice, subjects could have
distinct preferences, leading to incomplete information about the underlying
cost function of the subject. This paper proposes a two-step approach
integrating preference learning into the recourse generation problem. In the
first step, we design a question-answering framework to refine the confidence
set of the Mahalanobis matrix cost of the subject sequentially. Then, we
generate recourse by utilizing two methods: gradient-based and graph-based
cost-adaptive recourse that ensures validity while considering the whole
confidence set of the cost matrix. The numerical evaluation demonstrates the
benefits of our approach over state-of-the-art baselines in delivering
cost-efficient recourse recommendations.
- Abstract(参考訳): algorithmic recourseは、不利な機械学習分類決定を覆すために、被験者にコスト効率の良いアクションを推奨する。
文献における既存の手法の多くは、コスト関数に関する完全な知識の仮定の下でリコースを生成する。
実世界の実践では、被験者は異なる好みを持ち、対象の原価関数に関する不完全な情報をもたらす可能性がある。
本稿では,選好学習をリコース生成問題に統合する2段階アプローチを提案する。
最初のステップでは、被験者のマハラノビス行列コストの信頼性セットを逐次改善するための質問応答フレームワークを設計する。
次に,コストマトリックスの信頼度集合全体を考慮しつつ,妥当性を保証するグラデーションベースとグラフベースコスト適応リコースという2つの手法を用いてリコースを生成する。
この数値評価は,コスト効率の高いリコースレコメンデーションの提供において,最先端のベースラインに対するアプローチの利点を示すものである。
関連論文リスト
- $i$REPO: $i$mplicit Reward Pairwise Difference based Empirical Preference Optimization [12.266207199002604]
大規模言語モデル(LLM)は、人間の期待から外れた出力を生成することがある。
経験的選好最適化に暗黙的逆差分回帰を利用する,$i$REPO という新しいフレームワークを提案する。
i$REPOは, ソフトラベル, 自己生成応答, 経験的AIアノテータのロジットを用いて, 効果的に自己アライメントを実現することを示す。
論文 参考訳(メタデータ) (2024-05-24T05:42:11Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Rate-Optimal Policy Optimization for Linear Markov Decision Processes [65.5958446762678]
最安値の$widetilde O (sqrt K)$ regret, $K$はエピソード数を表す。
我々の研究は、バンディットフィードバックのある設定において最適な収束率(w.r.t.$K$)を確立する最初のものである。
現在、最適なレート保証を持つアルゴリズムは知られていない。
論文 参考訳(メタデータ) (2023-08-28T15:16:09Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Improved Regret for Efficient Online Reinforcement Learning with Linear
Function Approximation [69.0695698566235]
線形関数近似による強化学習と,コスト関数の逆変化について検討した。
本稿では,未知のダイナミクスと帯域幅フィードバックの一般設定に挑戦する,計算効率のよいポリシ最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T17:26:39Z) - Probabilistically Robust Recourse: Navigating the Trade-offs between
Costs and Robustness in Algorithmic Recourse [34.39887495671287]
本稿では,達成された(反感)と所望のリコース無効率とのギャップを同時に最小化する目的関数を提案する。
我々は,任意のインスタンスに対応するリコース無効化率を特徴付けるために,新しい理論的結果を開発した。
複数の実世界のデータセットを用いた実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-13T21:39:24Z) - Multi-Step Budgeted Bayesian Optimization with Unknown Evaluation Costs [28.254408148839644]
不均一な評価コストの設定に古典的な期待改善を一般化する非筋力的獲得関数を提案する。
我々の獲得関数は、様々な合成問題や実問題において、既存の手法よりも優れています。
論文 参考訳(メタデータ) (2021-11-12T02:18:26Z) - Low-Cost Algorithmic Recourse for Users With Uncertain Cost Functions [74.00030431081751]
本稿では,ユーザ固有のコスト関数の概念を定式化し,ユーザのための行動可能なリコースを識別する新しい手法を提案する。
本手法は,強いベースライン法に比べて最大25.89パーセントのユーザを満足させる。
論文 参考訳(メタデータ) (2021-11-01T19:49:35Z) - Toward Optimal Probabilistic Active Learning Using a Bayesian Approach [4.380488084997317]
アクティブラーニングは、コストの高いラベリングリソースを効率よく効果的に割り当てることで、ラベリングコストを削減することを目的としている。
提案したモデルにおける既存の選択戦略を再構築することにより、どの側面が現在の最先端に包含されていないかを説明することができる。
論文 参考訳(メタデータ) (2020-06-02T15:59:42Z) - Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning [100.73223416589596]
深層強化学習を用いたコスト依存型ポートフォリオ選択手法を提案する。
具体的には、価格系列パターンと資産相関の両方を抽出するために、新しい2ストリームポートフォリオポリシーネットワークを考案した。
蓄積したリターンを最大化し、強化学習によるコストの両立を抑えるため、新たなコスト感受性報酬関数が開発された。
論文 参考訳(メタデータ) (2020-03-06T06:28:17Z) - Robust Active Preference Elicitation [10.961537256186498]
ペアワイズ比較クエリを適度に数えることで、意思決定者の好みを抽出する問題について検討する。
私たちは、不足するリソースを割り当てるためのポリシーを選択する場合など、高利害ドメインのアプリケーションによって動機付けられています。
論文 参考訳(メタデータ) (2020-03-04T05:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。