論文の概要: QuEst: Enhancing Estimates of Quantile-Based Distributional Measures Using Model Predictions
- arxiv url: http://arxiv.org/abs/2507.05220v1
- Date: Mon, 07 Jul 2025 17:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.539139
- Title: QuEst: Enhancing Estimates of Quantile-Based Distributional Measures Using Model Predictions
- Title(参考訳): QuEst: モデル予測を用いた量子ベースの分布測定の強化
- Authors: Zhun Deng, Thomas P Zollo, Benjamin Eyre, Amogh Inamdar, David Madras, Richard Zemel,
- Abstract要約: 提案するQuEstは、観測データとインプットデータをマージしてポイント推定を行う、原則化されたフレームワークである。
QuEstは、尾のリスク(CVaR)から、クォータイルのような人口セグメントまで、経済学、社会学、教育、医学などの分野の中心となる様々な手段をカバーしている。
我々は、QuEstを多次元メトリクスに拡張し、これや他のハイブリッド推定器の分散をさらに低減するための追加の最適化手法を導入する。
- 参考スコア(独自算出の注目度): 12.851704083461616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As machine learning models grow increasingly competent, their predictions can supplement scarce or expensive data in various important domains. In support of this paradigm, algorithms have emerged to combine a small amount of high-fidelity observed data with a much larger set of imputed model outputs to estimate some quantity of interest. Yet current hybrid-inference tools target only means or single quantiles, limiting their applicability for many critical domains and use cases. We present QuEst, a principled framework to merge observed and imputed data to deliver point estimates and rigorous confidence intervals for a wide family of quantile-based distributional measures. QuEst covers a range of measures, from tail risk (CVaR) to population segments such as quartiles, that are central to fields such as economics, sociology, education, medicine, and more. We extend QuEst to multidimensional metrics, and introduce an additional optimization technique to further reduce variance in this and other hybrid estimators. We demonstrate the utility of our framework through experiments in economic modeling, opinion polling, and language model auto-evaluation.
- Abstract(参考訳): 機械学習モデルがますます有能になるにつれて、それらの予測は、さまざまな重要な領域における不足データや高価なデータを補うことができる。
このパラダイムを支持するために、アルゴリズムは、少量の高忠実度観測データと、より大きなインプットモデル出力とを組み合わせて、ある量の興味を見積もっている。
しかし、現在のハイブリッド推論ツールは、手段または単一の量子化のみをターゲットにしており、多くの重要なドメインやユースケースに適用性を制限する。
本稿では,観測データとインプットデータをマージして点推定値と厳密な信頼区間を導出するQuEstについて述べる。
QuEstは、尾のリスク(CVaR)から、クォータイルのような人口セグメントまで、経済学、社会学、教育、医学などの分野の中心となる様々な手段をカバーしている。
我々は、QuEstを多次元メトリクスに拡張し、これや他のハイブリッド推定器の分散をさらに低減するための追加の最適化手法を導入する。
我々は,経済モデリング,世論調査,言語モデル自動評価の実験を通じて,我々のフレームワークの有用性を実証する。
関連論文リスト
- A General Approach for Determining Applicability Domain of Machine Learning Models [1.8551396341435895]
機械学習モデルの適用可能性のドメインに関する知識は、正確で信頼性の高いモデル予測を保証するために不可欠である。
我々は,カーネル密度推定を用いたモデル領域の評価手法を開発した。
化学知識に基づく無関係と判断された化学物質群は,本測定値と有意な相違が認められた。
論文 参考訳(メタデータ) (2024-05-28T15:41:16Z) - MAUVE Scores for Generative Models: Theory and Practice [95.86006777961182]
本報告では,テキストや画像の生成モデルで発生するような分布のペア間の比較尺度であるMAUVEについて述べる。
我々は、MAUVEが人間の文章の分布と現代のニューラル言語モデルとのギャップを定量化できることを発見した。
我々は、MAUVEが既存のメトリクスと同等以上の画像の既知の特性を識別できることを視覚領域で実証する。
論文 参考訳(メタデータ) (2022-12-30T07:37:40Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Divergence Frontiers for Generative Models: Sample Complexity,
Quantization Level, and Frontier Integral [58.434753643798224]
多様性フロンティアは生成モデルの評価フレームワークとして提案されている。
分岐フロンティアのプラグイン推定器のサンプル複雑性の非漸近的境界を確立する。
また,スムーズな分布推定器の統計的性能を調べることにより,分散フロンティアの枠組みも強化する。
論文 参考訳(メタデータ) (2021-06-15T06:26:25Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Transfer Learning with Multi-source Data: High-dimensional Inference for
Group Distributionally Robust Models [0.0]
マルチソースデータによる学習はモデル一般化可能性の向上に役立ち、多くの重要な統計問題に不可欠なものである。
本稿では,マルチソースデータに対する複数の高次元回帰モデルについて考察する。
我々は,高次元マクシミン効果に対する有効信頼区間を構築するための新しいDenseNetサンプリング手法を考案した。
論文 参考訳(メタデータ) (2020-11-15T16:15:10Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Introduction to Rare-Event Predictive Modeling for Inferential
Statisticians -- A Hands-On Application in the Prediction of Breakthrough
Patents [0.0]
本稿では,予測性能の最適化を目的とした定量的分析のための機械学習(ML)手法を提案する。
両フィールド間の潜在的な相乗効果について考察する。
我々は,コンピュータサイエンスの用語のデミスティフィケーションを目指して,定量的な社会科学の聴衆に手持ちの予測モデルの導入を行っている。
論文 参考訳(メタデータ) (2020-03-30T13:06:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。