論文の概要: Heuristic Pathologies and Further Variance Reduction via Uncertainty Propagation in the AIVAT Family of Techniques
- arxiv url: http://arxiv.org/abs/2605.14261v1
- Date: Thu, 14 May 2026 02:04:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.575104
- Title: Heuristic Pathologies and Further Variance Reduction via Uncertainty Propagation in the AIVAT Family of Techniques
- Title(参考訳): AIVAT テクニックファミリーにおける不確実性伝播によるヒューリスティックな病態とさらなる変動軽減
- Authors: Juho Kim, Tuomas Sandholm,
- Abstract要約: AIVAT推定の不確かさを定量化するために、不確実性がどのように伝播できるかを示す。
実験では,1万本のポーカーハンドのデータセットを用いて,病態と不確実性を示す。
- 参考スコア(独自算出の注目度): 62.94836578759359
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How should an agent's performance in a multiagent environment be evaluated when there is a limited sample size or a high cost of running a trial? The AIVAT family of variance reduction techniques was proposed to address this challenge by introducing unbiased low-variance estimators of agents' expected payoffs. An important component of AIVAT is a heuristic value function that discriminates between potentially low- and high-value counterfactual histories. A notable gap in the literature is that there is little to no constraint or guideline on how the heuristic value function should be chosen or how uncertainty in its output should be handled. In our first contribution, we parameterize the heuristic value function to highlight AIVAT's potential vulnerabilities: a) the sample variance can be set pathologically low by directly applying gradient descent on the sample variance, and b) one can p-hack to draw a desired statistical conclusion via gradient descent/ascent on the test statistic. The main takeaway is that the heuristic value function should be fixed prior to observing the evaluation data! In our second contribution, we show how the heuristic uncertainty can be propagated to quantify the uncertainty of AIVAT estimates. It is then possible to further reduce the variance using inverse-variance weighted averaging, but AIVAT's unbiasedness guarantee may have to be sacrificed. In our experiments, we use a dataset of 10,000 poker hands to demonstrate our heuristic pathology and uncertainty results, with the latter yielding a 43.0% reduction in the number of samples (poker hands) needed to draw statistical conclusions.
- Abstract(参考訳): 多エージェント環境でのエージェントのパフォーマンスは、限られたサンプルサイズやトライアルのコストが高い場合にどのように評価されるべきだろうか?
AIVATファミリーの分散低減技術は、エージェントの期待した利益の偏りのない低分散推定器を導入することでこの問題に対処するために提案された。
AIVATの重要な構成要素は、潜在的に低値と高値の反事実履歴を識別するヒューリスティックな値関数である。
文学における顕著なギャップは、ヒューリスティックな値関数をどのように選択するか、その出力の不確実性を扱うべきかに関する制約やガイドラインがほとんど存在しないことである。
最初のコントリビューションでは、AIATの潜在的な脆弱性を強調するために、ヒューリスティックな値関数をパラメータ化しています。
イ サンプル分散に勾配降下を直接適用することにより、病理的に低い値を設定することができること。
b) 試験統計に基づく勾配降下/上昇により所望の統計的結論を引き出すことができる。
主な特徴は、ヒューリスティックな値関数が評価データを見る前に修正されるべきであるということだ。
第2のコントリビューションでは、AIVAT推定の不確実性を定量化するために、ヒューリスティックな不確実性をいかに伝播するかを示す。
すると、逆分散重み付け平均化による分散をさらに低減することができるが、AIATの偏りのない保証は犠牲にされなければならない。
我々の実験では、1万本のポーカーハンドのデータセットを用いて、我々のヒューリスティックな病理と不確実性の結果を示し、後者は統計的な結論を得るために必要なサンプルの数(ポーカーハンド)を43.0%削減する。
関連論文リスト
- A Generative Framework for Causal Estimation via Importance-Weighted Diffusion Distillation [55.53426007439564]
観察データから個別化された治療効果を推定することは因果推論における中心的な課題である。
逆確率重み付け(IPW)は、この問題に対するよく確立された解決策であるが、現代のディープラーニングフレームワークへの統合は依然として限られている。
本稿では,拡散モデルの事前学習と重み付きスコア蒸留を組み合わせた新しい生成フレームワークであるIWDDを提案する。
論文 参考訳(メタデータ) (2025-05-16T17:00:52Z) - Progressive Generalization Risk Reduction for Data-Efficient Causal Effect Estimation [30.49865329385806]
因果効果推定(英: Causal effect Estimation、CEE)は、エンティティの観測されていない反事実結果を予測する重要なツールである。
本稿では,ラベル付きデータサンプルが最初から不足している,より現実的なCEE設定について検討する。
バッチワイズラベル取得のためのモデルアグノスティック因果アクティブラーニング(MACAL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-18T03:17:40Z) - Prognostic Covariate Adjustment for Logistic Regression in Randomized
Controlled Trials [1.5020330976600735]
本研究では, 確率的スコア調整により, 条件付オッズ比のウォルド試験のパワーを一定のサンプルサイズで向上させることができることを示す。
我々はg-computationを用いて、確率的スコア調整の範囲を、限界リスク差、相対リスク、確率比推定に基づいて拡張する。
論文 参考訳(メタデータ) (2024-02-29T06:53:16Z) - A Stable and Efficient Covariate-Balancing Estimator for Causal Survival Effects [33.62020029799266]
本研究では、条件に依存しない検閲データにおける生存因果効果の推定の問題に対処する。
これは、小さな推定確率の逆数の使用と、その結果の推定誤差の増幅に対処する。
合成および半合成データに関する実験において理論的結果を検証する。
論文 参考訳(メタデータ) (2023-10-01T00:04:29Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - U-Statistics for Importance-Weighted Variational Inference [29.750633016889655]
重要重み付き変分推論における推定のばらつきを低減するために,U-statisticsを用いた手法を提案する。
実験により,U-Statistic variance reduction(U-Statistic variance)の低減は,モデルの範囲での推論性能の大幅な改善につながることが確認された。
論文 参考訳(メタデータ) (2023-02-27T16:08:43Z) - Data-Driven Influence Functions for Optimization-Based Causal Inference [105.5385525290466]
統計的汎関数に対するガトー微分を有限差分法で近似する構成的アルゴリズムについて検討する。
本研究では,確率分布を事前知識がないが,データから推定する必要がある場合について検討する。
論文 参考訳(メタデータ) (2022-08-29T16:16:22Z) - Prediction Sets Adaptive to Unknown Covariate Shift [18.105704797438417]
有限サンプル被覆保証付き予測集合は非形式的であることを示す。
そこで我々は,予測セットを効率的に構築する,新しいフレキシブルな分散フリー手法PredSet-1Stepを提案する。
論文 参考訳(メタデータ) (2022-03-11T17:53:14Z) - Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。
本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。
いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文 参考訳(メタデータ) (2022-01-15T17:21:26Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。