Fugu-MT 論文翻訳(概要): Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

論文の概要: Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

arxiv url: http://arxiv.org/abs/2603.05226v1
Date: Thu, 05 Mar 2026 14:39:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-06 22:06:11.271644
Title: Learning Optimal Individualized Decision Rules with Conditional Demographic Parity
Title（参考訳）: 条件付き復号化パリティを用いた最適個別決定規則の学習
Authors: Wenhai Cui, Wen Su, Donglin Zeng, Xingqiu Zhao,
Abstract要約: 本稿では,DPとCDPの制約を最適IDDの推定に組み込む新しい枠組みを提案する。 DP および CDP 制約下での理論的に最適な IDR は、制約のない最適 IDR に摂動を適用することで得られることを示す。
参考スコア（独自算出の注目度）: 7.125803218132866
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Individualized decision rules (IDRs) have become increasingly prevalent in societal applications such as personalized marketing, healthcare, and public policy design. However, a critical ethical concern arises from the potential discriminatory effects of IDRs trained on biased data. These algorithms may disproportionately harm individuals from minority subgroups defined by sensitive attributes like gender, race, or language. To address this issue, we propose a novel framework that incorporates demographic parity (DP) and conditional demographic parity (CDP) constraints into the estimation of optimal IDRs. We show that the theoretically optimal IDRs under DP and CDP constraints can be obtained by applying perturbations to the unconstrained optimal IDRs, enabling a computationally efficient solution. Theoretically, we derive convergence rates for both policy value and the fairness constraint term. The effectiveness of our methods is illustrated through comprehensive simulation studies and an empirical application to the Oregon Health Insurance Experiment.
Abstract（参考訳）: 個別化意思決定ルール(IDR)は、パーソナライズされたマーケティング、ヘルスケア、公共政策設計といった社会的な応用においてますます普及している。しかし、批判的な倫理的懸念は、偏りのあるデータに基づいて訓練されたIDRの潜在的な差別効果から生じる。これらのアルゴリズムは、性別、人種、言語などの敏感な属性によって定義された少数サブグループの個人に不均等に害を与える可能性がある。そこで本研究では,DPとCDPの制約を最適IDRの推定に組み込んだ新しい枠組みを提案する。 DP と CDP の制約下での理論的に最適な IDR は、制約のない最適 IDR に摂動を適用することにより、計算効率のよい解が得られることを示す。理論的には、政策値と公正制約項の両方の収束率を導出する。本手法の有効性は,包括的シミュレーション研究とオレゴン健康保険実験への実証的応用を通じて明らかにした。

関連論文リスト

Locally Private Nonparametric Contextual Multi-armed Bandits [10.579415536953132]
ローカルディファレンシャルプライバシ(LDP)の下での非パラメトリックコンテキスト多重武装バンディット(MAB)の課題に対処する。一致したミニマックス下界で支持されるミニマックス最適性を示す一様信頼束縛型推定器を開発した。
論文参考訳（メタデータ） (2025-03-11T07:00:57Z)
Counterfactually Fair Reinforcement Learning via Sequential Data Preprocessing [13.34215548232296]
対実公正(CF)は、因果推論に基づく有望な統計ツールであり、公正を定式化し研究する。我々は,最適なCFポリシーを理論的に特徴づけ,その定常性を証明し,最適なCFポリシーの探索を大幅に単純化する。我々は、不公平を防ぎ、シミュレーションを通じて最適な価値を得るための政策学習アプローチを証明し、検証する。
論文参考訳（メタデータ） (2025-01-10T22:27:44Z)
Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文参考訳（メタデータ） (2024-05-26T05:38:50Z)
Optimal and Fair Encouragement Policy Evaluation and Learning [9.036025934093963]
本研究は, 陽性の潜在的な違反を含む最適治療規則の因果同定とロバストな評価について検討した。一般制約下でのパラメタライズされたポリシークラスを解くための2段階のアルゴリズムを開発し、分散感応的後悔境界を求める。本研究は, SNAP給付のリマインダーデータ, 保険申請の無作為化促進, および電子監視による事前管理リリースに基づく3つのケーススタディである。
論文参考訳（メタデータ） (2023-09-12T20:45:30Z)
Improved Policy Evaluation for Randomized Trials of Algorithmic Resource Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文参考訳（メタデータ） (2023-02-06T05:17:22Z)
Policy learning "without" overlap: Pessimism and generalized empirical Bernstein's inequality [94.89246810243053]
本論文は,事前収集した観測値を利用して最適な個別化決定規則を学習するオフライン政策学習について検討する。既存の政策学習法は、一様重なりの仮定、すなわち、全ての個々の特性に対する全ての作用を探索する正当性は、境界を低くしなければならない。我々は,点推定の代わりに低信頼度境界(LCB)を最適化する新しいアルゴリズムであるPPLを提案する。
論文参考訳（メタデータ） (2022-12-19T22:43:08Z)
Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文参考訳（メタデータ） (2022-06-11T18:03:26Z)
Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文参考訳（メタデータ） (2022-01-31T20:58:47Z)
Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文参考訳（メタデータ） (2021-06-01T12:01:51Z)
Minimax Pareto Fairness: A Multi Objective Perspective [24.600419295290504]
グループフェアネスは多目的最適化問題であり、各敏感なグループリスクは別個の目的である。これらの制約を満たすために、ディープニューラルネットワークと互換性のある単純なアルゴリズムを提供する。提案手法は,収入予測,ICU患者死亡率,皮膚病変分類,信用リスク評価の実際のケーススタディについて検証した。
論文参考訳（メタデータ） (2020-11-03T16:21:53Z)
Fair Policy Targeting [0.6091702876917281]
社会福祉プログラムにおける個人に対する介入を標的とする主な関心事の1つは差別である。本稿では,公平かつ効率的な処理割り当てルールの設計に関する課題に対処する。
論文参考訳（メタデータ） (2020-05-25T20:45:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。