論文の概要: Optimized Labeling Resource Allocation for Prediction-Assisted Inference via OPAL
- arxiv url: http://arxiv.org/abs/2606.03211v1
- Date: Tue, 02 Jun 2026 06:09:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 10:57:21.725256
- Title: Optimized Labeling Resource Allocation for Prediction-Assisted Inference via OPAL
- Title(参考訳): OPALによる予測支援推論のための最適ラベル付け資源配置
- Authors: Virginia L. Ma, Emmanuel J. Candès,
- Abstract要約: 本稿では,最も分散度の低い推定器を生成するためのスムーズなポリシーの抽出可能なクラス内で,ラベル付け戦略を学習するOPALを紹介する。
我々は,OPALが有限標本において名目的カバレッジを達成し,よりラベル付き標本をはるかに多く持つ手法から期待できる精度を有することを示す。
- 参考スコア(独自算出の注目度): 11.25614500155564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active Statistical Inference is a new framework to make precise claims about population parameters with provable statistical guarantees. It uses a predictive "black-box" machine learning (ML) model to strategically decide which data points to label, roughly prioritizing samples for which the ML model is unsure about their label values. A major issue is that the framework can be brittle when uncertainty estimates are noisy. This paper introduces OPAL (Optimized Policy for Allocation of Labels), which learns a labeling strategy within a tractable class of smooth policies to yield estimators with the lowest variance. In effect, OPAL is an end-to-end pipeline that turns a black-box model's uncertainty scores into a data-adaptive labeling strategy and then performs inference on the collected samples. We evaluate OPAL on real datasets spanning medical imaging data, computational social science, and proteomics. As a concrete example, we consider predicting breast cancer subtype from histopathology images and using OPAL to form valid confidence intervals for odds ratios for different demographic groups. We show that OPAL achieves nominal coverage in finite samples and has the accuracy one expects from methods which have far more labeled samples.
- Abstract(参考訳): アクティブ統計推論は、証明可能な統計保証を伴う人口パラメータに関する正確な主張を行うための新しいフレームワークである。
予測的な"ブラックボックス"機械学習(ML)モデルを使用して、どのデータポイントをラベルにするかを戦略的に決定し、MLモデルがラベル値について不確実なサンプルを大まかに優先順位付けする。
大きな問題は、不確実性見積がノイズの多い場合にフレームワークが脆くなることだ。
本稿では,ラベルの配置を最適化するOPAL(Optimized Policy for Allocation of Labels)を提案する。
事実上OPALは、ブラックボックスモデルの不確実性スコアをデータ適応型ラベリング戦略に変換し、収集したサンプルに対して推論を実行するエンドツーエンドパイプラインである。
我々は、医療画像データ、計算社会科学、およびプロテオミクスにまたがる実際のデータセット上でOPALを評価する。
具体例として,病理組織像から乳癌の亜型を予測し,OPALを用いて異なる集団群に対するオッズ比の信頼区間を定式化することを検討した。
我々は,OPALが有限標本において名目的カバレッジを達成し,よりラベル付き標本をはるかに多く持つ手法から期待できる精度を有することを示す。
関連論文リスト
- Industrializing Prediction-Powered Inference: The GLIDE Library for Reliable GenAI and Agentic Systems Evaluation [2.28126966226433]
予測駆動推論(PPI)は、双方をバイアス付き推定と有効な信頼区間に結合する。
我々は,最先端のPPI推定器を統一したオープンソースのPythonライブラリであるGLIDEを紹介する。
GLIDEには、再現可能なモンテカルロ検証スイート、メソッド選択のための実証的根拠決定ツリー、エージェント評価ケーススタディが付属している。
論文 参考訳(メタデータ) (2026-05-29T13:10:35Z) - Adaptive Conformal Inference by Particle Filtering under Hidden Markov Models [8.505262415500168]
本稿では,この問題に対処するための粒子フィルタリング手法を活用する適応型共形推論フレームワークを提案する。
観測不能な隠れ状態に直接焦点をあてるのではなく、隠れ状態の実際の後部分布の近似として重み付き粒子を革新的に利用する。
論文 参考訳(メタデータ) (2024-11-03T13:15:32Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - Pseudo Label Selection is a Decision Problem [0.0]
Pseudo-Labelingは、半教師あり学習におけるシンプルで効果的なアプローチである。
擬似ラベル付きデータの選定を導く基準が必要である。
過信だが誤った予測を持つインスタンスを選択することで、オーバーフィッティングを最終モデルに伝達することができる。
論文 参考訳(メタデータ) (2023-09-25T07:48:02Z) - Improving group robustness under noisy labels using predictive
uncertainty [0.9449650062296823]
ノイズラベル下での最悪のグループ精度を改善するために,モデルの予測不確実性を利用する。
本稿では,モデルがノイズラベルに頑健でありながら,刺激的な手がかりを学習するのを防ぐ,新しいEntropy based Debiasing(END)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-14T04:40:50Z) - Self-Adaptive Label Augmentation for Semi-supervised Few-shot
Classification [121.63992191386502]
Few-shotの分類は、ラベル付きサンプルがわずかにあれば、新しいタスクをうまく一般化できるモデルを学ぶことを目的としている。
そこで本研究では,手動で定義した指標を用いて,ラベルのない各サンプルに適切なラベルを割り当てる半教師付き小ショット分類手法を提案する。
SALAの目新しいところは、タスク適応計量であり、エンドツーエンドの方法で異なるタスクに対するメトリックを適応的に学習することができる。
論文 参考訳(メタデータ) (2022-06-16T13:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。