論文の概要: Optimal Recourse Summaries via Bi-Objective Decision Tree Learning
- arxiv url: http://arxiv.org/abs/2605.07598v1
- Date: Fri, 08 May 2026 11:16:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.013081
- Title: Optimal Recourse Summaries via Bi-Objective Decision Tree Learning
- Title(参考訳): 双方向決定木学習による最適リコース要約
- Authors: Ioannis Chatzis, Jason Liartis, Athanasios Voulodimos, Giorgos Stamou,
- Abstract要約: Actionable Recourseは、好ましくない結果を変えるためのアクションを個人に提供する。
局所的な行動の集約は費用がかかり、しばしば矛盾するため、グローバルな監査やバイアス検出には適していない。
リコースサマリーは、集団を分割し、サブグループごとに1つの共有アクションを割り当てることで、この制限に対処する。
- 参考スコア(独自算出の注目度): 9.108496029183568
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Actionable Recourse provides individuals with actions they can take to change an unfavorable classifier outcome. While useful at the instance level, it is ill-suited for global auditing and bias detection, since aggregating local actions is costly and often inconsistent. Recourse Summaries address this limitation by partitioning the population and assigning one shared action per subgroup, enabling comparison across subgroups. Designing summaries involves a fundamental trade-off between recourse effectiveness and recourse cost, which existing methods do not adequately address. We introduce Summaries of Optimal and Global Actionable Recourse (SOGAR), which formulates recourse summary learning as an optimal decision tree learning problem and finds the Pareto front -- the complete set of solutions where improving one objective necessarily worsens the other. SOGAR enables post-hoc selection of the desired trade-off without retraining. Using shallow axis-parallel decision trees and sparse leaf actions, SOGAR produces stable, low-cost, and effective recourse summaries that outperform existing approaches across effectiveness and cost metrics.
- Abstract(参考訳): Actionable Recourseは、好ましくない分類結果を変えるためのアクションを個人に提供する。
インスタンスレベルでは有用であるが、局所的なアクションの集約はコストがかかり、しばしば一貫性がないため、グローバルな監査やバイアス検出には適していない。
Recourse Summaries はこの制限に対処し、集団を分割し、サブグループごとに1つの共有アクションを割り当て、サブグループ間での比較を可能にする。
要約を設計するには、既存の手法では適切に対処できない、レコメンデーションの有効性とレコメンデーションコストの基本的なトレードオフが伴う。
最適・グローバル・アクションブル・リコース(SOGAR)のサマリーを導入し、リコース・サマリー・ラーニングを最適決定木学習問題として定式化し、パレート・フロント(Pareto front)という完全なソリューションの集合を見出す。
SOGARは、再トレーニングすることなく、所望のトレードオフのポストホック選択を可能にする。
浅い軸平行決定木とスパースリーフアクションを用いて、SOGARは安定的で低コストで効果的なリコースサマリーを生成し、既存のアプローチを効率性とコストのメトリクスで上回ります。
関連論文リスト
- Chain of Uncertain Rewards with Large Language Models for Reinforcement Learning [52.48243762705385]
Chain of Uncertain Rewards (CoUR)は、大きな言語モデル(LLM)を統合して報酬関数の設計と評価を効率化する新しいフレームワークである。
我々は、CoURがより良い性能を実現し、報酬評価のコストを大幅に削減できることを示します。
論文 参考訳(メタデータ) (2026-04-15T05:44:14Z) - GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization [133.27496265096445]
我々は,グループ相対的政策最適化を,その適合性を検討することなく,マルチリワード設定で適用する方法を示す。
次に、これらの問題を解決するための新しい政策最適化手法であるグループ報酬分離正規化政策最適化(GDPO)を紹介する。
GDPOはGRPOを一貫して上回り、マルチリワード強化学習最適化の有効性と一般化性を示す。
論文 参考訳(メタデータ) (2026-01-08T18:59:24Z) - Representative Action Selection for Large Action Space: From Bandits to MDPs [47.980675309210746]
強化学習(RL)環境の家族間で共有される非常に大きな行動空間から,小さな代表的行動サブセットを選択するという課題について検討する。
我々の目標は、家族のすべての環境において、ほぼ最適な行動を含む一定の行動のサブセットを特定することであり、それによって、すべての行動を完全に評価することなく、効率的な学習を可能にすることである。
論文 参考訳(メタデータ) (2025-11-27T04:49:23Z) - Recursive Reward Aggregation [60.51668865089082]
本稿では,報酬関数の変更を不要としたフレキシブルな行動アライメントのための代替手法を提案する。
マルコフ決定過程(MDP)の代数的視点を導入することにより、ベルマン方程式が報酬の生成と集約から自然に現れることを示す。
我々のアプローチは決定論的および決定論的設定の両方に適用され、価値に基づくアルゴリズムとアクター批判的アルゴリズムとシームレスに統合される。
論文 参考訳(メタデータ) (2025-07-11T12:37:20Z) - GLANCE: Global Actions in a Nutshell for Counterfactual Explainability [10.25011737760687]
2つのアルゴリズムからなる多目的かつ適応的なフレームワークであるGLANCEを紹介する。
C-GLANCEは、特徴空間と反現実的アクションの空間の両方を考慮するクラスタリングアプローチを採用している。
T-GLANCEは柔軟性を高めるための追加機能を提供する。
論文 参考訳(メタデータ) (2024-05-29T09:24:25Z) - Contextual Linear Optimization with Partial Feedback [35.38485630117593]
本研究では,異なるタイプのフィードバックを持つ文脈線形最適化(CLO)のためのオフライン学習アルゴリズムのクラスを提案する。
我々は,IERMに対して,不特定モデルクラスとフレキシブルな推定方法の選択を可能にする,新しい高速遅延境界を提供する。
論文 参考訳(メタデータ) (2024-05-26T13:27:27Z) - Modeling the Q-Diversity in a Min-max Play Game for Robust Optimization [61.39201891894024]
群分布的ロバスト最適化(群 DRO)は、事前定義された群に対する最悪の損失を最小限にすることができる。
グループDROフレームワークをQ-Diversityを提案して再構築する。
インタラクティブなトレーニングモードによって特徴付けられるQ-Diversityは、アノテーションからグループ識別を緩和し、直接パラメータ化を行う。
論文 参考訳(メタデータ) (2023-05-20T07:02:27Z) - Probabilistically Robust Recourse: Navigating the Trade-offs between
Costs and Robustness in Algorithmic Recourse [34.39887495671287]
本稿では,達成された(反感)と所望のリコース無効率とのギャップを同時に最小化する目的関数を提案する。
我々は,任意のインスタンスに対応するリコース無効化率を特徴付けるために,新しい理論的結果を開発した。
複数の実世界のデータセットを用いた実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-13T21:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。