論文の概要: Perfect Counterfactuals in Imperfect Worlds: Modelling Noisy Implementation of Actions in Sequential Algorithmic Recourse
- arxiv url: http://arxiv.org/abs/2410.02273v2
- Date: Fri, 15 Aug 2025 08:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:22.932136
- Title: Perfect Counterfactuals in Imperfect Worlds: Modelling Noisy Implementation of Actions in Sequential Algorithmic Recourse
- Title(参考訳): 不完全な世界における完全なカウンターファクトアル:逐次的アルゴリズム的会話における行動の雑音的実装をモデル化する
- Authors: Yueqing Xuan, Kacper Sokol, Mark Sanderson, Jeffrey Chan,
- Abstract要約: アルゴリズムによる議論は、自動意思決定によって悪影響を受ける個人に対する行動を提案する。
リコースを知ることは、ユーザーがそれを完璧に実装できることを保証するものではない。
したがって、リコース生成はその準最適あるいはうるさい実装を予測すべきである。
- 参考スコア(独自算出の注目度): 26.57812122315108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Algorithmic recourse suggests actions to individuals who have been adversely affected by automated decision-making, helping them to achieve the desired outcome. Knowing the recourse, however, does not guarantee that users can implement it perfectly, either due to environmental variability or personal choices. Recourse generation should thus anticipate its sub-optimal or noisy implementation. While several approaches construct recourse that is robust to small perturbations -- e.g., arising due to its noisy implementation -- they assume that the entire recourse is implemented in a single step, thus model the noise as one-off and uniform. But these assumptions are unrealistic since recourse often entails multiple sequential steps, which makes it harder to implement and subject to increasing noise. In this work, we consider recourse under plausible noise that adheres to the local data geometry and accumulates at every step of the way. We frame this problem as a Markov Decision Process and demonstrate that such a distribution of plausible noise satisfies the Markov property. We then propose the RObust SEquential (ROSE) recourse generator for tabular data; our method produces a series of steps leading to the desired outcome even when they are implemented imperfectly. Given plausible modelling of sub-optimal human actions and greater recourse robustness to accumulated uncertainty, ROSE provides users with a high chance of success while maintaining low recourse cost. Empirical evaluation shows that our algorithm effectively navigates the inherent trade-off between recourse robustness and cost while ensuring its sparsity and computational efficiency.
- Abstract(参考訳): アルゴリズムによる会話は、自動意思決定によって悪影響を及ぼされた個人に対する行動を示し、彼らが望ましい結果を達成する手助けをする。
しかし、環境変動性や個人の選択により、ユーザーが完璧に実装できることは保証されていない。
したがって、リコース生成はその準最適あるいはうるさい実装を予測すべきである。
いくつかのアプローチは、小さな摂動に対して堅牢なリコース(例えば、ノイズのある実装によって生じる)を構築する一方で、リコース全体が単一のステップで実装されていると仮定し、ノイズを1つのオフと均一にモデル化する。
しかし、これらの仮定は非現実的であり、リコースはしばしば複数のシーケンシャルなステップを必要とするため、実装が難しく、ノイズが増大する。
本研究では,局所的なデータ幾何に固執し,各ステップで蓄積する可塑性雑音下での談話について考察する。
この問題をマルコフ決定過程とみなし、可塑性雑音の分布がマルコフの性質を満たすことを実証する。
次に,表データに対してRObust Sequential(ROSE)レコース生成器を提案する。
最適でない人間の行動の妥当なモデリングと、蓄積された不確実性に対するより大きなリコースロバスト性を考えると、ROSEは低リコースコストを維持しながら高い成功率をユーザに提供する。
経験的評価により,提案アルゴリズムは,空間性と計算効率の確保を図りながら,レコメンデーションの堅牢性とコストのトレードオフを効果的に行なえることを示す。
関連論文リスト
- RANSAC Revisited: An Improved Algorithm for Robust Subspace Recovery under Adversarial and Noisy Corruptions [16.45408984254899]
破損しないサンプルのかなりの部分を含む低次元部分空間を復元することを目的としている。
この問題に対する既存のアプローチは、しばしば高い計算コストに悩まされるか、制限的な分布仮定に依存する。
本稿では,標準的なRANSACの障害モードを正確に特定し,修正する2段階アルゴリズムであるRANSAC+を提案する。
論文 参考訳(メタデータ) (2025-04-13T16:47:03Z) - Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - One-step Noisy Label Mitigation [86.57572253460125]
ノイズラベルのトレーニング過程に対する有害な影響の軽減がますます重要になっている。
モデルに依存しないノイズラベル緩和パラダイムである1ステップアンチノイズ(OSA)を提案する。
我々はOSAの優位性を実証的に実証し、トレーニングの堅牢性の向上、タスク転送性の向上、デプロイメントの容易性、計算コストの削減を強調した。
論文 参考訳(メタデータ) (2024-10-02T18:42:56Z) - ROPO: Robust Preference Optimization for Large Language Models [59.10763211091664]
外部モデルの助けを借りずにノイズ耐性とノイズサンプルのフィルタリングを統合する反復アライメント手法を提案する。
Mistral-7BとLlama-2-7Bで広く使われている3つのデータセットの実験では、ROPOが既存の嗜好アライメント法を大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2024-04-05T13:58:51Z) - Distributionally Robust Recourse Action [12.139222986297263]
recourseアクションは、別の結果を受け取るためにインスタンスを修正できる特定の方法を示すことで、特定のアルゴリズム上の決定を説明することを目的としている。
本研究では、モデルシフトの混合の下で有効となる確率の高いリコースアクションを生成する分散ロバスト・リコース・アクション(DiRRAc)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-22T08:52:01Z) - STEEL: Singularity-aware Reinforcement Learning [14.424199399139804]
バッチ強化学習(RL)は、事前収集されたデータを利用して最適なポリシーを見つけることを目的としている。
本稿では,状態空間と行動空間の両方に特異性を持たせる新しいバッチRLアルゴリズムを提案する。
悲観主義といくつかの技術的条件を利用して、提案したアルゴリズムに対する最初の有限サンプル後悔保証を導出する。
論文 参考訳(メタデータ) (2023-01-30T18:29:35Z) - Probabilistically Robust Recourse: Navigating the Trade-offs between
Costs and Robustness in Algorithmic Recourse [34.39887495671287]
本稿では,達成された(反感)と所望のリコース無効率とのギャップを同時に最小化する目的関数を提案する。
我々は,任意のインスタンスに対応するリコース無効化率を特徴付けるために,新しい理論的結果を開発した。
複数の実世界のデータセットを用いた実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-13T21:39:24Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Algorithmic Recourse in Partially and Fully Confounded Settings Through
Bounding Counterfactual Effects [0.6299766708197883]
アルゴリズムリコースは、自動意思決定システムからより好ましい結果を得るために、個人に実行可能なレコメンデーションを提供することを目的としている。
既存の手法では,データから学習した因果モデルを用いて,隠れたコンバウンディングや付加雑音などの仮定をモデル化する手法が提案されている。
本稿では、これらの仮定を緩和し、観測不能な共役および任意の構造方程式を可能にする離散確率変数に対する別のアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-22T15:07:49Z) - Square Root Principal Component Pursuit: Tuning-Free Noisy Robust Matrix
Recovery [8.581512812219737]
本稿では,ノイズや外周波で劣化した観測結果から低ランク行列を復元する新しい枠組みを提案する。
平方根のラッソにインスパイアされたこの新しい定式化は、ノイズレベルに関する事前の知識を必要としない。
正規化パラメータの1つの普遍的な選択は、(事前未知の)雑音レベルに比例した再構成誤差を達成するのに十分であることを示す。
論文 参考訳(メタデータ) (2021-06-17T02:28:11Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。