論文の概要: Achieving Long-Term Fairness in Sequential Decision Making
- arxiv url: http://arxiv.org/abs/2204.01819v1
- Date: Mon, 4 Apr 2022 20:05:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 13:05:35.823305
- Title: Achieving Long-Term Fairness in Sequential Decision Making
- Title(参考訳): シーケンス決定における長期的公正性の実現
- Authors: Yaowei Hu and Lu Zhang
- Abstract要約: 本稿では,長期的公正な意思決定を実現するための枠組みを提案する。
我々は,長期的公正度を測定するための定量的ツールとして,時間ラベル付き因果グラフに対する経路特異的な効果を考察した。
- 参考スコア(独自算出の注目度): 9.046461405943502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a framework for achieving long-term fair sequential
decision making. By conducting both the hard and soft interventions, we propose
to take path-specific effects on the time-lagged causal graph as a quantitative
tool for measuring long-term fairness. The problem of fair sequential decision
making is then formulated as a constrained optimization problem with the
utility as the objective and the long-term and short-term fairness as
constraints. We show that such an optimization problem can be converted to a
performative risk optimization. Finally, repeated risk minimization (RRM) is
used for model training, and the convergence of RRM is theoretically analyzed.
The empirical evaluation shows the effectiveness of the proposed algorithm on
synthetic and semi-synthetic temporal datasets.
- Abstract(参考訳): 本稿では,長期的公正な意思決定を実現するための枠組みを提案する。
硬度と軟度の両方の介入を行うことで, 長期フェアネスを定量的に測定する手段として, 時間遅延因果グラフに経路特異的な効果を及ぼすことを提案する。
フェアシーケンシャルな意思決定の問題は、目的としてのユーティリティと、制約としての長期的および短期的公正性による制約付き最適化問題として定式化される。
このような最適化問題を性能的リスク最適化に変換できることを示す。
最後に、モデルトレーニングに繰り返しリスク最小化(RRM)を用い、理論的にRRMの収束を解析する。
実験による評価は,提案アルゴリズムが合成および半合成時間データセットに与える影響を示す。
関連論文リスト
- Fair Risk Minimization under Causal Path-Specific Effect Constraints [3.0232957374216953]
本稿では,機械学習を用いて最適な予測を推定するためのフレームワークを提案する。
平均二乗誤差とクロスエントロピーリスク基準に基づく制約付き最適化のための閉形式解を導出する。
論文 参考訳(メタデータ) (2024-08-03T02:05:43Z) - A Re-solving Heuristic for Dynamic Assortment Optimization with Knapsack Constraints [14.990988698038686]
資源knapsack制約下でのMNLを用いたマルチステージ動的アソシエーション最適化問題について検討する。
正確な最適動的アソシエーション解を計算的に抽出可能とすることで、決定論的線形プログラムを周期的に最適化する再解法を実践的戦略として採用する。
目的の分母を制約に効果的に変換するエポックな新しい再解法を提案する。
論文 参考訳(メタデータ) (2024-07-08T02:40:20Z) - Successive Refinement in Large-Scale Computation: Advancing Model
Inference Applications [67.76749044675721]
階層化分解能計算の解を導入する。
これらの解により、最終結果よりも早い段階でより解像度の低い結果が得られる。
論文 参考訳(メタデータ) (2024-02-11T15:36:33Z) - Long-Term Fair Decision Making through Deep Generative Models [12.333165351086171]
本稿では,連続的な意思決定システムにおいて,グループ格差を長期にわたって緩和することを目的とした,長期的公正な機械学習について検討する。
時間的因果グラフを利用して、異なる人口集団の介入分布間の1-ワッサーシュタイン距離を定量的な尺度として十分に大きな時間ステップで利用する。
深層生成モデルにより生成された高忠実度データに基づいて決定モデルを訓練する3相学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-20T17:44:50Z) - Data-driven Piecewise Affine Decision Rules for Stochastic Programming
with Covariate Information [5.054099828483128]
非部分的決定(PADR)に埋め込まれた経験的リスク(M)手法を提案する。
提案手法は理論的整合性を持つ広範で非クラスな非制約問題に適用可能であることを示す。
論文 参考訳(メタデータ) (2023-04-26T16:08:49Z) - Stochastic Methods for AUC Optimization subject to AUC-based Fairness
Constraints [51.12047280149546]
公正な予測モデルを得るための直接的なアプローチは、公正な制約の下で予測性能を最適化することでモデルを訓練することである。
フェアネスを考慮した機械学習モデルのトレーニング問題を,AUCに基づくフェアネス制約のクラスを対象とする最適化問題として定式化する。
フェアネス測定値の異なる実世界のデータに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-12-23T22:29:08Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - False Correlation Reduction for Offline Reinforcement Learning [115.11954432080749]
本稿では,実効的かつ理論的に証明可能なアルゴリズムであるオフラインRLに対するfalSe Correlation Reduction (SCORE)を提案する。
SCOREは、標準ベンチマーク(D4RL)において、様々なタスクにおいて3.1倍の高速化でSoTA性能を達成することを実証的に示す。
論文 参考訳(メタデータ) (2021-10-24T15:34:03Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - State-Visitation Fairness in Average-Reward MDPs [5.190207094732672]
我々は,時間的拡大した意思決定,特にマルコフ決定プロセス(mdps)を定式化した意思決定場面における公平性について検討する。
提案する公平性の概念は,各州の長期訪問頻度が指定された割合以上であることを保証する。
提案手法は,予測平均逆方向と長期状態視周波数の同時近似を保証する。
論文 参考訳(メタデータ) (2021-02-14T10:20:53Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。