論文の概要: SADA: Safe and Adaptive Inference with Multiple Black-Box Predictions
- arxiv url: http://arxiv.org/abs/2509.21707v1
- Date: Fri, 26 Sep 2025 00:02:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.081073
- Title: SADA: Safe and Adaptive Inference with Multiple Black-Box Predictions
- Title(参考訳): SADA: 複数のブラックボックス予測による安全で適応的な推論
- Authors: Jiawei Shan, Yiming Dong, Jiwei Zhao,
- Abstract要約: 実世界のアプリケーションは、金標準実験の高コストと時間要件のためにラベル付きデータが不足していることが多い。
本稿では,複数のブラックボックス予測を安全かつ適応的に未知の品質で集約する手法を提案する。
- 参考スコア(独自算出の注目度): 4.100095195067256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world applications often face scarce labeled data due to the high cost and time requirements of gold-standard experiments, whereas unlabeled data are typically abundant. With the growing adoption of machine learning techniques, it has become increasingly feasible to generate multiple predicted labels using a variety of models and algorithms, including deep learning, large language models, and generative AI. In this paper, we propose a novel approach that safely and adaptively aggregates multiple black-box predictions with unknown quality while preserving valid statistical inference. Our method provides two key guarantees: (i) it never performs worse than using the labeled data alone, regardless of the quality of the predictions; and (ii) if any one of the predictions (without knowing which one) perfectly fits the ground truth, the algorithm adaptively exploits this to achieve either a faster convergence rate or the semiparametric efficiency bound. We demonstrate the effectiveness of the proposed algorithm through experiments on both synthetic and benchmark datasets.
- Abstract(参考訳): 実世界のアプリケーションは、金標準実験の高コストと時間要件のためにラベル付きデータが不足している場合が多いが、ラベルなしのデータは通常豊富である。
機械学習技術の普及に伴い、ディープラーニング、大規模言語モデル、生成AIなど、さまざまなモデルとアルゴリズムを使用して、予測された複数のラベルを生成することが可能になった。
本稿では,複数のブラックボックス予測を未知の品質で安全にかつ適応的に集約する手法を提案する。
我々の方法は2つの重要な保証を提供する。
一 予測の質によらず、ラベル付きデータのみを使用するのに劣らないこと。
2) 予測のどれかが基底的真理に完全に適合しているかを知らない場合、アルゴリズムはこれを適応的に利用し、より高速な収束率または半パラメトリック効率境界を達成する。
合成データセットとベンチマークデータセットの両方を用いた実験により,提案アルゴリズムの有効性を実証する。
関連論文リスト
- Data-Efficient Prediction-Powered Calibration via Cross-Validation [35.04154147859041]
本稿では,限られたキャリブレーションデータを効率的に利用して予測器を微調整し,合成ラベルのバイアスを推定する手法を提案する。
提案手法は,AI生成決定に対する厳密なカバレッジ保証を備えた予測セットを生成する。
論文 参考訳(メタデータ) (2025-07-27T13:31:02Z) - Collaborative Prediction: To Join or To Disjoin Datasets [5.9697789282446605]
人口減少を最小限に抑えるために適切なデータセットを選択する実用的なアルゴリズムを開発することの課題について検討する。
オラクルの不等式とデータ駆動推定器を活用することにより、アルゴリズムは高い確率で人口減少を低減する。
論文 参考訳(メタデータ) (2025-06-12T20:25:07Z) - Conformal Validity Guarantees Exist for Any Data Distribution (and How to Find Them) [14.396431159723297]
理論上,共形予測はテキスト共同データ分布に拡張可能であることを示す。
最も一般的なケースは計算に実用的でないが、具体的には特定の共形アルゴリズムを導出するための手順を概説する。
論文 参考訳(メタデータ) (2024-05-10T17:40:24Z) - Overcoming Overconfidence for Active Learning [1.2776312584227847]
本稿では,アクティブな学習シナリオで発生する過信の問題に対処する2つの新しい手法を提案する。
1つ目はCross-Mix-and-Mix(CMaM)と呼ばれる拡張戦略で、限られたトレーニング分布を拡張してモデルを校正することを目的としている。
2つ目は Ranked Margin Sampling (RankedMS) という選択戦略である。
論文 参考訳(メタデータ) (2023-08-21T09:04:54Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Efficient and Differentiable Conformal Prediction with General Function
Classes [96.74055810115456]
本稿では,複数の学習可能なパラメータに対する共形予測の一般化を提案する。
本研究は, クラス内において, ほぼ有効な人口被覆率, ほぼ最適効率を実現していることを示す。
実験の結果,提案アルゴリズムは有効な予測セットを学習し,効率を著しく向上できることがわかった。
論文 参考訳(メタデータ) (2022-02-22T18:37:23Z) - Dash: Semi-Supervised Learning with Dynamic Thresholding [72.74339790209531]
我々は、ラベルのない例を使ってモデルをトレーニングする半教師付き学習(SSL)アプローチを提案する。
提案手法であるDashは、ラベルなしデータ選択の観点から適応性を享受する。
論文 参考訳(メタデータ) (2021-09-01T23:52:29Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。