論文の概要: Long-Term Fairness in Sequential Multi-Agent Selection with Positive Reinforcement
- arxiv url: http://arxiv.org/abs/2407.07350v1
- Date: Wed, 10 Jul 2024 04:03:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 17:51:32.225447
- Title: Long-Term Fairness in Sequential Multi-Agent Selection with Positive Reinforcement
- Title(参考訳): 正の強化を伴う連続多エージェント選択における長期的公正性
- Authors: Bhagyashree Puranik, Ozgur Guldogan, Upamanyu Madhow, Ramtin Pedarsani,
- Abstract要約: 大学入学や採用のような選抜プロセスでは、少数派からの応募者に対する偏見は肯定的なフィードバックをもたらすと仮定される。
グリーディスコアとフェアネスのバランスをとるマルチエージェント・フェア・グリーディ政策を提案する。
以上の結果から, 正の強化は長期的公正性にとって有望なメカニズムであるが, 進化モデルの変動に頑健な政策を慎重に設計する必要があることが示唆された。
- 参考スコア(独自算出の注目度): 21.44063458579184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While much of the rapidly growing literature on fair decision-making focuses on metrics for one-shot decisions, recent work has raised the intriguing possibility of designing sequential decision-making to positively impact long-term social fairness. In selection processes such as college admissions or hiring, biasing slightly towards applicants from under-represented groups is hypothesized to provide positive feedback that increases the pool of under-represented applicants in future selection rounds, thus enhancing fairness in the long term. In this paper, we examine this hypothesis and its consequences in a setting in which multiple agents are selecting from a common pool of applicants. We propose the Multi-agent Fair-Greedy policy, that balances greedy score maximization and fairness. Under this policy, we prove that the resource pool and the admissions converge to a long-term fairness target set by the agents when the score distributions across the groups in the population are identical. We provide empirical evidence of existence of equilibria under non-identical score distributions through synthetic and adapted real-world datasets. We then sound a cautionary note for more complex applicant pool evolution models, under which uncoordinated behavior by the agents can cause negative reinforcement, leading to a reduction in the fraction of under-represented applicants. Our results indicate that, while positive reinforcement is a promising mechanism for long-term fairness, policies must be designed carefully to be robust to variations in the evolution model, with a number of open issues that remain to be explored by algorithm designers, social scientists, and policymakers.
- Abstract(参考訳): 公正な意思決定に関する文献の多くは、一発決定のためのメトリクスに焦点を当てているが、最近の研究は、長期的な社会的公正性に肯定的な影響を与える、シーケンシャルな意思決定を設計することの興味深い可能性を高めている。
大学入学や採用のような選抜プロセスでは、未登録グループからの応募者に対してわずかに偏りを呈し、将来の選考ラウンドにおける未登録応募者のプールを増やす肯定的なフィードバックを与え、長期的に公正性を高めることが仮定される。
本稿では、複数のエージェントが共通の応募者のプールから選択している環境で、この仮説とその結果について検討する。
グリーディスコアの最大化と公平性のバランスをとるマルチエージェント・フェア・グリーディ政策を提案する。
この方針の下では,資源プールと入場者が,集団間のスコア分布が同一である場合に,エージェントが設定した長期フェアネス目標に収束することを示す。
我々は、合成および適応された実世界のデータセットを通して、非同一のスコア分布下での平衡の存在の実証的証拠を提供する。
次に、より複雑な応募者プールの進化モデルについて注意を喚起し、エージェントによる非協調的な行動が負の強化を引き起こす可能性があり、非表現者の割合が減少する。
以上の結果から, 肯定的強化は長期的公正性にとって有望なメカニズムであるが, アルゴリズム設計者, 社会科学者, 政策立案者らによる未解決の問題が数多く残っているため, 進化モデルの変動に頑健な政策を慎重に設計する必要があることが示唆された。
関連論文リスト
- Performative Prediction on Games and Mechanism Design [69.7933059664256]
エージェントが過去の正確性に基づいて予測を信頼するかを判断する集団リスクジレンマについて検討する。
予測が集合的な結果を形成するにつれて、社会福祉は関心の指標として自然に現れる。
よりよいトレードオフを実現し、それらをメカニズム設計に使用する方法を示します。
論文 参考訳(メタデータ) (2024-08-09T16:03:44Z) - Average-Case Analysis of Iterative Voting [33.68929251752289]
反復投票は、社会的選択における戦略的意思決定の自然なモデルである。
先行研究は、選択された結果の均衡度に対する反復的な複数の効果を解析した。
本研究は, 平均ケース分析をより広範な分布クラスに拡張し, 反復的複数回による福祉改善や低下を区別する。
論文 参考訳(メタデータ) (2024-02-13T00:46:46Z) - Fairness in Algorithmic Recourse Through the Lens of Substantive
Equality of Opportunity [15.78130132380848]
アルゴリズムによる会話は、AIシステムとのインタラクションにおいて人に対してエージェンシーを与える手段として注目を集めている。
近年の研究では、個人の初期状況の違いにより、会話自体が不公平である可能性があることが示されている。
個人が行動するのに時間がかかるほど、設定が変更される可能性があるからだ。
論文 参考訳(メタデータ) (2024-01-29T11:55:45Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - Estimating and Incentivizing Imperfect-Knowledge Agents with Hidden
Rewards [4.742123770879715]
実際には、インセンティブ提供者はインセンティブ付きエージェントの報酬実現を観察できないことが多い。
本稿では,自己関心学習エージェントと学習プリンシパルの繰り返し選択ゲームについて検討する。
我々は,プリンシパルのインセンティブとエージェントの選択履歴のみを入力とする推定器を導入する。
論文 参考訳(メタデータ) (2023-08-13T08:12:01Z) - Moral Machine or Tyranny of the Majority? [25.342029326793917]
Moral Machineプロジェクトでは、自動運転車に関する"Trolley Problems"に対する回答をクラウドソーシングした。
Noothigattu et al. は、各個人の好みを近似した線形関数を推論し、これらの線形モデルを集団全体の平均パラメータによって集約することを提案した。
本稿では,この平均化メカニズムについて検討し,戦略的効果の有無の公平性に焦点をあてる。
論文 参考訳(メタデータ) (2023-05-27T00:49:11Z) - Learning Informative Representation for Fairness-aware Multivariate
Time-series Forecasting: A Group-based Perspective [50.093280002375984]
多変量時系列予測モデル(MTS)では変数間の性能不公平性が広く存在する。
フェアネスを意識したMTS予測のための新しいフレームワークであるFairForを提案する。
論文 参考訳(メタデータ) (2023-01-27T04:54:12Z) - Social Diversity Reduces the Complexity and Cost of Fostering Fairness [63.70639083665108]
不完全な情報や公平性の柔軟な基準を前提とした干渉機構の効果について検討する。
多様性の役割を定量化し、情報収集の必要性を減らす方法を示す。
この結果から,多様性が変化し,公正性向上を目指す機関に新たなメカニズムが開放されることが示唆された。
論文 参考訳(メタデータ) (2022-11-18T21:58:35Z) - Long-term dynamics of fairness: understanding the impact of data-driven
targeted help on job seekers [1.357291726431012]
我々は、統計と機械学習を組み合わせたアプローチを用いて、労働市場の介入による長期的な公正効果を評価する。
我々は、求職者を選択的に支援する公共雇用機関による意思決定の影響を調べるためのモデルを開発し、利用する。
実世界のシステムにおけるトレードオフの定量化と長期的公正効果を評価するためには、周辺労働市場の慎重なモデリングが不可欠である。
論文 参考訳(メタデータ) (2022-08-17T12:03:23Z) - Statistical discrimination in learning agents [64.78141757063142]
統計的差別は、訓練人口のバイアスとエージェントアーキテクチャの両方の関数としてエージェントポリシーに現れる。
我々は、リカレントニューラルネットワークを使用するエージェントによる差別の低減と、トレーニング環境のバイアスの低減が示される。
論文 参考訳(メタデータ) (2021-10-21T18:28:57Z) - Multi-Stage Decentralized Matching Markets: Uncertain Preferences and
Strategic Behaviors [91.3755431537592]
本稿では、現実世界のマッチング市場で最適な戦略を学ぶためのフレームワークを開発する。
我々は,不確実性レベルが特徴の福祉対フェアネストレードオフが存在することを示す。
シングルステージマッチングと比較して、マルチステージマッチングで参加者がより良くなることを証明します。
論文 参考訳(メタデータ) (2021-02-13T19:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。