論文の概要: Robustness of Refugee-Matching Gains to Off-Policy Evaluation Choices
- arxiv url: http://arxiv.org/abs/2605.06686v1
- Date: Sat, 25 Apr 2026 22:48:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.684874
- Title: Robustness of Refugee-Matching Gains to Off-Policy Evaluation Choices
- Title(参考訳): 外部評価選択に対するリフュージマッチゲインのロバスト性
- Authors: Kirk Bansak, Elisabeth Paulson, Dominik Rothenhäusler, Jeremy Ferwerda, Jens Hainmueller, Michael Hotard,
- Abstract要約: 本稿では,アメリカにおける難民マッチングの文脈における影響評価結果の安定性について述べる。
我々は、逆確率重み付け(IPW)や拡張逆確率重み付け(AIPW)の多変量を含むいくつかの評価手法を用いる。
影響推定はすべてのシナリオにおいて等しく、ほとんどのケースでは統計的に有意である。
- 参考スコア(独自算出の注目度): 3.355773637193057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous research has investigated the potential of refugee matching for boosting refugee outcomes, first considered by Bansak et al. (2018). This paper demonstrates the stability of counterfactual impact evaluation results in the context of refugee matching in the United States using a range of off-policy evaluation methods. In order to estimate counterfactual impact and test the robustness of our results, we employ several evaluation methods, including inverse probability weighting (IPW) and multiple variants of augmented inverse probability weighting (AIPW). We also consider various modifications, including alternative modeling architectures and different assignment procedures. The impact estimates remain consistent in magnitude in all scenarios as well as statistically significant in most cases. Furthermore, the estimates are also consistent with the results originally presented in Bansak et al. (2018).
- Abstract(参考訳): 以前の研究では、Bansak et al (2018) が最初に検討した難民マッチングによる難民結果の促進の可能性について研究されている。
本稿では,米国における難民マッチングの文脈における影響評価結果の安定性を,様々なオフ・ポリティクス評価手法を用いて実証する。
その結果, 逆確率重み付け (IPW) や多変量拡張逆確率重み付け (AIPW) などの評価手法を応用した。
また、代替モデリングアーキテクチャや異なる代入手順など、様々な修正についても検討する。
影響推定はすべてのシナリオにおいて等しく、ほとんどのケースでは統計的に有意である。
さらに、見積もりはもともとBansak et al (2018)で提示された結果と一致している。
関連論文リスト
- Practical Improvements of A/B Testing with Off-Policy Estimation [51.25970890274447]
従来の手法よりも分散度を低くする非バイアスのオフ・ポリティクス推定器のファミリーを導入する。
提案手法の有効性と実用性を理論的に検証した。
論文 参考訳(メタデータ) (2025-06-12T13:11:01Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Uncertainty-Aware Instance Reweighting for Off-Policy Learning [63.31923483172859]
本研究では,不確実性を考慮した逆確率スコア推定器 (UIPS) を提案する。
実世界の3つのレコメンデーションデータセットを用いた実験結果から,提案したUIPS推定器の有効サンプル効率が示された。
論文 参考訳(メタデータ) (2023-03-11T11:42:26Z) - Improved Policy Evaluation for Randomized Trials of Algorithmic Resource
Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。
我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文 参考訳(メタデータ) (2023-02-06T05:17:22Z) - An Instrumental Variable Approach to Confounded Off-Policy Evaluation [11.785128674216903]
オフ政治評価(Off-policy Evaluation、OPE)は、目標政策の回帰を推定する手法である。
本稿では,マルコフ決定過程における一貫した OPE のインストゥルメンタル変数 (IV) に基づく手法を提案する。
論文 参考訳(メタデータ) (2022-12-29T22:06:51Z) - Low Variance Off-policy Evaluation with State-based Importance Sampling [21.727827944373793]
本稿では, 重みの計算から特定の状態を取り除き, ばらつきを低減できる状態ベース重要度サンプリング推定器を提案する。
4つの領域の実験により、状態ベースの手法は、従来の手法に比べて、ばらつきの低減と精度の向上を一貫して達成していることが示された。
論文 参考訳(メタデータ) (2022-12-07T19:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。