論文の概要: Balancing Competing Objectives with Noisy Data: Score-Based Classifiers
for Welfare-Aware Machine Learning
- arxiv url: http://arxiv.org/abs/2003.06740v4
- Date: Thu, 16 Jul 2020 03:57:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 08:38:48.352668
- Title: Balancing Competing Objectives with Noisy Data: Score-Based Classifiers
for Welfare-Aware Machine Learning
- Title(参考訳): 雑音データによる競合対象のバランシング:福祉対応機械学習のためのスコアベース分類器
- Authors: Esther Rolf and Max Simchowitz and Sarah Dean and Lydia T. Liu and
Daniel Bj\"orkegren and Moritz Hardt and Joshua Blumenstock
- Abstract要約: 我々は、私的目的(利益など)と公共目的(社会福祉など)とを明確にトレードオフするアルゴリズム政策を研究する。
我々の結果は、社会福祉に影響を与える決定に機械学習を使うことにおける本質的にのトレードオフを浮き彫りにした。
- 参考スコア(独自算出の注目度): 43.518329314620416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While real-world decisions involve many competing objectives, algorithmic
decisions are often evaluated with a single objective function. In this paper,
we study algorithmic policies which explicitly trade off between a private
objective (such as profit) and a public objective (such as social welfare). We
analyze a natural class of policies which trace an empirical Pareto frontier
based on learned scores, and focus on how such decisions can be made in noisy
or data-limited regimes. Our theoretical results characterize the optimal
strategies in this class, bound the Pareto errors due to inaccuracies in the
scores, and show an equivalence between optimal strategies and a rich class of
fairness-constrained profit-maximizing policies. We then present empirical
results in two different contexts -- online content recommendation and
sustainable abalone fisheries -- to underscore the applicability of our
approach to a wide range of practical decisions. Taken together, these results
shed light on inherent trade-offs in using machine learning for decisions that
impact social welfare.
- Abstract(参考訳): 現実世界の決定には多くの競合する目的が伴うが、アルゴリズム的決定はしばしば単一の目的関数で評価される。
本稿では,私的目的(利益など)と公共的目的(社会福祉など)を明確にトレードオフするアルゴリズム政策について検討する。
我々は,経験的パレートフロンティアを学習スコアに基づいて追跡する自然な政策の類型を分析し,ノイズやデータ制限のある状況下での意思決定の方法に着目する。
本理論は,このクラスにおける最適戦略を特徴付け,スコアの不正確さによるパレート誤差を限定し,最適戦略と公平性に制約された利益最大化政策の富裕層との等価性を示す。
そして、オンラインコンテンツレコメンデーションと持続可能なアワビ漁業という2つの異なる文脈で実証的な結果を示し、我々のアプローチを幅広い実践的意思決定に適用する可能性を強調します。
これらの結果は、社会福祉に影響を与える決定に機械学習を使うことにおける本質的にのトレードオフを浮き彫りにした。
関連論文リスト
- Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Non-linear Welfare-Aware Strategic Learning [10.448052192725168]
本稿では,戦略的個人行動の存在下でのアルゴリズム的意思決定について考察する。
まず,先行研究におけるエージェントベスト応答モデルを非線形設定に一般化する。
制限条件下でのみ3つの福祉が同時に最適な状態が得られることを示す。
論文 参考訳(メタデータ) (2024-05-03T01:50:03Z) - Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Optimizing Credit Limit Adjustments Under Adversarial Goals Using
Reinforcement Learning [42.303733194571905]
我々は、強化学習技術を用いて最適なクレジットカード制限調整ポリシーを発見し、自動化することを模索する。
本研究は、信用限度調整に強化学習フレームワークを適用するための概念構造を確立する。
論文 参考訳(メタデータ) (2023-06-27T16:10:36Z) - Fair Off-Policy Learning from Observational Data [30.77874108094485]
我々は、公正な政治学学習のための新しい枠組みを提案する。
まず、政治以外の学習における公平性の概念を定式化する。
次に、異なる公正概念の下で最適なポリシーを学習するためのニューラルネットワークベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-15T10:47:48Z) - Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。
我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-11-08T04:06:23Z) - Off-Policy Evaluation with Policy-Dependent Optimization Response [90.28758112893054]
我々は,テキスト政治に依存した線形最適化応答を用いた非政治評価のための新しいフレームワークを開発した。
摂動法による政策依存推定のための非バイアス推定器を構築する。
因果介入を最適化するための一般的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-25T20:25:37Z) - Coping with Mistreatment in Fair Algorithms [1.2183405753834557]
教師付き学習環境におけるアルゴリズムの公平性を検討し,等価機会指標の分類器最適化の効果を検討する。
このバイアスを軽減するための概念的にシンプルな方法を提案する。
提案手法を厳密に解析し,その効果を示す実世界データセット上で評価する。
論文 参考訳(メタデータ) (2021-02-22T03:26:06Z) - Decentralized Reinforcement Learning: Global Decision-Making via Local
Economic Transactions [80.49176924360499]
我々は、シーケンシャルな意思決定問題を解決するために、単純で専門的で自己関心のあるエージェントの社会を指示する枠組みを確立する。
我々は分散強化学習アルゴリズムのクラスを導出する。
我々は、より効率的な移動学習のための社会固有のモジュラー構造の潜在的な利点を実証する。
論文 参考訳(メタデータ) (2020-07-05T16:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。