論文の概要: (Machine) Learning What Policies Value
- arxiv url: http://arxiv.org/abs/2206.00727v1
- Date: Wed, 1 Jun 2022 19:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-04 05:16:01.300612
- Title: (Machine) Learning What Policies Value
- Title(参考訳): (機械)政策の価値を学習する
- Authors: Daniel Bj\"orkegren, Joshua E. Blumenstock, Samsun Knight
- Abstract要約: 本稿では,観測された割当決定と一致した値を明らかにする手法を開発した。
機械学習の手法を使って、各個人が介入によってどれだけの恩恵を受けるかを推定します。
メキシコのPROGRESAアンチ・ポルノ・プログラムを分析して、このアプローチを実証する。
- 参考スコア(独自算出の注目度): 2.0267847227859144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When a policy prioritizes one person over another, is it because they benefit
more, or because they are preferred? This paper develops a method to uncover
the values consistent with observed allocation decisions. We use machine
learning methods to estimate how much each individual benefits from an
intervention, and then reconcile its allocation with (i) the welfare weights
assigned to different people; (ii) heterogeneous treatment effects of the
intervention; and (iii) weights on different outcomes. We demonstrate this
approach by analyzing Mexico's PROGRESA anti-poverty program. The analysis
reveals that while the program prioritized certain subgroups -- such as
indigenous households -- the fact that those groups benefited more implies that
they were in fact assigned a lower welfare weight. The PROGRESA case
illustrates how the method makes it possible to audit existing policies, and to
design future policies that better align with values.
- Abstract(参考訳): 方針が人を優先する場合、より多くの利益があるためか、あるいは優先されているためか?
本稿では,観測された割当決定と一致する値を明らかにする手法を開発した。
機械学習を使って、各個人が介入から得られる利益を見積もり、その割り当てを調整します。
(i)異なる人に割り当てられた厚生重量
二 介入による不均一な治療効果、及び
(iii)異なる結果の重み付け。
我々は、メキシコのprogresa anti-povertyプログラムを分析して、このアプローチを実証する。
分析の結果、同プログラムは特定のサブグループ(例えば、先住民の世帯)を優先していたが、これらのグループがより利益を得たという事実は、実際により低い福祉体重を割り当てられたことを示している。
progresaのケースは、このメソッドが既存のポリシーを監査し、価値に合致する将来のポリシーを設計する方法を説明している。
関連論文リスト
- Structural Interventions and the Dynamics of Inequality [0.0]
技術的ソリューションは、社会的変化を起こすために、外部のコンテキスト対応の介入と組み合わせなければならないことを示す。
この研究は、構造的不等式が、一見バイアスのない決定機構によって永続することができる方法を強調している。
論文 参考訳(メタデータ) (2024-06-03T13:44:38Z) - Policy Gradient with Active Importance Sampling [55.112959067035916]
政策勾配法(PG法)はISの利点を大いに生かし、以前に収集したサンプルを効果的に再利用することができる。
しかし、ISは歴史的サンプルを再重み付けするための受動的ツールとしてRLに採用されている。
我々は、政策勾配のばらつきを減らすために、サンプルを収集する最良の行動ポリシーを模索する。
論文 参考訳(メタデータ) (2024-05-09T09:08:09Z) - Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Off-Policy Evaluation for Large Action Spaces via Policy Convolution [60.6953713877886]
ポリシ・コンボリューション(Policy Convolution)のファミリーは、アクション内の潜在構造を使用して、ログとターゲットポリシを戦略的に畳み込みます。
合成およびベンチマークデータセットの実験では、PCを使用する場合の平均二乗誤差(MSE)が顕著に改善されている。
論文 参考訳(メタデータ) (2023-10-24T01:00:01Z) - Evaluating the Fairness of Discriminative Foundation Models in Computer
Vision [51.176061115977774]
本稿では,CLIP (Contrastive Language-Pretraining) などの差別基盤モデルのバイアス評価のための新しい分類法を提案する。
そして、これらのモデルにおけるバイアスを緩和するための既存の手法を分類学に関して体系的に評価する。
具体的には,ゼロショット分類,画像検索,画像キャプションなど,OpenAIのCLIPとOpenCLIPモデルをキーアプリケーションとして評価する。
論文 参考訳(メタデータ) (2023-10-18T10:32:39Z) - Policy Dispersion in Non-Markovian Environment [53.05904889617441]
本稿では,非マルコフ環境下での国家行動ペアの歴史から,多様な政策の学習を試みる。
まず、ポリシー埋め込みを学習するために、トランスフォーマーベースの手法を採用する。
次に,政策埋め込みを積み重ねて分散行列を構築し,多様な政策の集合を誘導する。
論文 参考訳(メタデータ) (2023-02-28T11:58:39Z) - Identification of Subgroups With Similar Benefits in Off-Policy Policy
Evaluation [60.71312668265873]
我々は,パーソナライズの必要性と自信ある予測とのバランスをとる方法を開発した。
本手法は不均一な治療効果の正確な予測に有効であることを示す。
論文 参考訳(メタデータ) (2021-11-28T23:19:12Z) - Optimal Mixture Weights for Off-Policy Evaluation with Multiple Behavior
Policies [3.855085732184416]
オフ政治評価は、行動ポリシーから収集されたオフラインデータを用いて目標ポリシーを評価する強化学習の鍵となる要素である。
本稿では,異なる行動ポリシーによって生成された推定器を正しく混合する方法について論じる。
シミュレーションリコメンデータシステムの実験から,提案手法は推定平均二乗誤差を低減するのに有効であることが示された。
論文 参考訳(メタデータ) (2020-11-29T12:57:54Z) - Fair Policy Targeting [0.6091702876917281]
社会福祉プログラムにおける個人に対する介入を標的とする主な関心事の1つは差別である。
本稿では,公平かつ効率的な処理割り当てルールの設計に関する課題に対処する。
論文 参考訳(メタデータ) (2020-05-25T20:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。