Fugu-MT 論文翻訳(概要): Fair Risk Minimization under Causal Path-Specific Effect Constraints

論文の概要: Fair Risk Minimization under Causal Path-Specific Effect Constraints

arxiv url: http://arxiv.org/abs/2408.01630v1
Date: Sat, 3 Aug 2024 02:05:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-06 19:10:37.682486
Title: Fair Risk Minimization under Causal Path-Specific Effect Constraints
Title（参考訳）: 因果経路特異的効果制約下における公正リスク最小化
Authors: Razieh Nabi, David Benkeser,
Abstract要約: 本稿では,機械学習を用いて最適な予測を推定するためのフレームワークを提案する。平均二乗誤差とクロスエントロピーリスク基準に基づく制約付き最適化のための閉形式解を導出する。
参考スコア（独自算出の注目度）: 3.0232957374216953
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper introduces a framework for estimating fair optimal predictions using machine learning where the notion of fairness can be quantified using path-specific causal effects. We use a recently developed approach based on Lagrange multipliers for infinite-dimensional functional estimation to derive closed-form solutions for constrained optimization based on mean squared error and cross-entropy risk criteria. The theoretical forms of the solutions are analyzed in detail and described as nuanced adjustments to the unconstrained minimizer. This analysis highlights important trade-offs between risk minimization and achieving fairnes. The theoretical solutions are also used as the basis for construction of flexible semiparametric estimation strategies for these nuisance components. We describe the robustness properties of our estimators in terms of achieving the optimal constrained risk, as well as in terms of controlling the value of the constraint. We study via simulation the impact of using robust estimators of pathway-specific effects to validate our theory. This work advances the discourse on algorithmic fairness by integrating complex causal considerations into model training, thus providing strategies for implementing fair models in real-world applications.
Abstract（参考訳）: 本稿では、経路固有の因果効果を用いて、公平性の概念を定量化できる機械学習を用いて、公正な予測を推定するためのフレームワークを提案する。最近開発されたラグランジュ乗算器に基づく無限次元関数推定手法を用いて、平均二乗誤差とクロスエントロピーリスク基準に基づく制約付き最適化のための閉形式解を導出する。解の理論的形式は詳細に解析され、制約のない最小値に対するニュアンス調整として記述される。この分析は、リスク最小化とフェアネス達成の間の重要なトレードオフを強調します。理論解はまた、これらのニュアンス成分に対するフレキシブルな半パラメトリック推定戦略の構築の基盤としても用いられる。最適制約リスクの達成と制約値の制御の両面から推定器のロバスト性について述べる。本研究では,経路特異的効果のロバストな推定器による影響をシミュレーションにより検証し,その妥当性を検証した。この研究は、複雑な因果的考察をモデルトレーニングに統合し、現実のアプリケーションで公正なモデルを実装するための戦略を提供することにより、アルゴリズムフェアネスに関する議論を前進させる。

関連論文リスト

Conditional Risk Minimization with Side Information: A Tractable, Universal Optimal Transport Framework [0.0]
条件付きリスク最小化は、リスクをサイド情報に基づいて評価する必要がある高リスクな決定に発生する。最適輸送における新しいユニオン・ボールの定式化に基づいて構築された,分布的に堅牢な条件付きリスク最小化のための普遍的枠組みを導入する。
論文参考訳（メタデータ） (2025-09-27T05:22:53Z)
Aligning Latent Spaces with Flow Priors [72.24305287508474]
本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文参考訳（メタデータ） (2025-06-05T16:59:53Z)
Wasserstein Distributionally Robust Nonparametric Regression [9.65010022854885]
本稿では、ワッサーシュタイン分布性非パラメトリック推定器の一般化特性について検討する。我々は,過度の局地的最悪のリスクに対して,非漸近的エラー境界を確立する。提案した推定器のロバスト性はシミュレーション研究を通じて評価し,MNISTデータセットへの適用例を示した。
論文参考訳（メタデータ） (2025-05-12T18:07:37Z)
Exogenous Matching: Learning Good Proposals for Tractable Counterfactual Estimation [1.9662978733004601]
本稿では, 抽出可能かつ効率的な対実表現推定のための重要サンプリング手法を提案する。対物推定器の共通上限を最小化することにより、分散最小化問題を条件分布学習問題に変換する。構造因果モデル (Structure Causal Models, SCM) の様々なタイプと設定による実験による理論的結果の検証と, 対実推定タスクにおける性能の実証を行った。
論文参考訳（メタデータ） (2024-10-17T03:08:28Z)
Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [61.580419063416734]
最近の構造化学習手法のストリームは、様々な最適化問題に対する技術の実践的状態を改善している。鍵となる考え方は、インスタンスを別々に扱うのではなく、インスタンス上の統計分布を利用することだ。本稿では,最適化を容易にし,一般化誤差を改善するポリシを摂動することでリスクを円滑にする手法について検討する。
論文参考訳（メタデータ） (2024-07-24T12:00:30Z)
Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文参考訳（メタデータ） (2024-05-26T05:38:50Z)
Statistical learning for constrained functional parameters in infinite-dimensional models [4.974815773537217]
無限次元統計モデルにおける等式制約や不等式制約の下で関数値パラメータを推定する枠組みを開発する。我々は,ラグランジュ型定式化を用いたペナル化集団リスクの最小化法として,この解を特徴付けている。提案手法の柔軟性と有効性について,様々な例,シミュレーション,実データを用いて実証する。
論文参考訳（メタデータ） (2024-04-15T14:59:21Z)
Bayesian Nonparametrics Meets Data-Driven Distributionally Robust Optimization [29.24821214671497]
機械学習と統計モデルのトレーニングは、しばしばデータ駆動型リスク基準の最適化を伴う。ベイズ的非パラメトリック(ディリクレ過程)理論と、スムーズなあいまいさ-逆選好の最近の決定論的モデルを組み合わせた、新しいロバストな基準を提案する。実用的な実装として、よく知られたディリクレプロセスの表現に基づいて、評価基準の抽出可能な近似を提案し、研究する。
論文参考訳（メタデータ） (2024-01-28T21:19:15Z)
Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。本手法は, 精度の高い問題に特に適している。提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文参考訳（メタデータ） (2023-11-08T00:10:21Z)
When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文参考訳（メタデータ） (2023-02-15T04:14:20Z)
Achieving Long-Term Fairness in Sequential Decision Making [9.046461405943502]
本稿では,長期的公正な意思決定を実現するための枠組みを提案する。我々は,長期的公正度を測定するための定量的ツールとして,時間ラベル付き因果グラフに対する経路特異的な効果を考察した。
論文参考訳（メタデータ） (2022-04-04T20:05:44Z)
Towards Deployment-Efficient Reinforcement Learning: Lower Bound and Optimality [141.89413461337324]
展開効率は、強化学習(RL)の多くの実世界の応用にとって重要な基準である本稿では,「制約付き最適化」の観点から,デプロイ効率の高いRL(DE-RL)の理論的定式化を提案する。
論文参考訳（メタデータ） (2022-02-14T01:31:46Z)
DROMO: Distributionally Robust Offline Model-based Policy Optimization [0.0]
モデルベース制御によるオフライン強化学習の問題点を考察する。分散ロバストなオフラインモデルベースポリシー最適化(DROMO)を提案する。
論文参考訳（メタデータ） (2021-09-15T13:25:14Z)
Safe Continuous Control with Constrained Model-Based Policy Optimization [0.0]
制約付き高次元制御のためのモデルベースセーフ探索アルゴリズムを提案する。また、モデル生成データによるポリシー探索を高速化する実用的なアルゴリズムも導入する。
論文参考訳（メタデータ） (2021-04-14T15:20:55Z)
Loss Bounds for Approximate Influence-Based Abstraction [81.13024471616417]
影響に基づく抽象化は、システムの残りの部分が与える「影響」とともに、局所的なサブプロブレムをモデル化することでレバレッジを得ることを目的としている。本稿では,理論的観点から,そのような手法の性能について考察する。交叉エントロピーで訓練されたニューラルネットワークは、近似的な影響表現を学習するのに適していることを示す。
論文参考訳（メタデータ） (2020-11-03T15:33:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。