論文の概要: Ensemble Threshold Calibration for Stable Sensitivity Control
- arxiv url: http://arxiv.org/abs/2510.02116v1
- Date: Thu, 02 Oct 2025 15:22:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.18621
- Title: Ensemble Threshold Calibration for Stable Sensitivity Control
- Title(参考訳): 安定感度制御のためのアンサンブル閾値校正法
- Authors: John N. Daras,
- Abstract要約: 本稿では,数千万組の幾何対もの幾何に対して,過度に分散した正確なリコールを実現するエンド・ツー・エンドのフレームワークを提案する。
我々のアプローチは、小さなエラーで常にリコールターゲットにヒットし、他のキャリブレーションと比較して冗長な検証を減らし、単一のTPU v3コア上でエンドツーエンドで実行します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Precise recall control is critical in large-scale spatial conflation and entity-matching tasks, where missing even a few true matches can break downstream analytics, while excessive manual review inflates cost. Classical confidence-interval cuts such as Clopper-Pearson or Wilson provide lower bounds on recall, but they routinely overshoot the target by several percentage points and exhibit high run-to-run variance under skewed score distributions. We present an end-to-end framework that achieves exact recall with sub-percent variance over tens of millions of geometry pairs, while remaining TPU-friendly. Our pipeline starts with an equigrid bounding-box filter and compressed sparse row (CSR) candidate representation, reducing pair enumeration by two orders of magnitude. A deterministic xxHash bootstrap sample trains a lightweight neural ranker; its scores are propagated to all remaining pairs via a single forward pass and used to construct a reproducible, score-decile-stratified calibration set. Four complementary threshold estimators - Clopper-Pearson, Jeffreys, Wilson, and an exact quantile - are aggregated via inverse-variance weighting, then fused across nine independent subsamples. This ensemble reduces threshold variance compared to any single method. Evaluated on two real cadastral datasets (approximately 6.31M and 67.34M pairs), our approach consistently hits a recall target within a small error, decreases redundant verifications relative to other calibrations, and runs end-to-end on a single TPU v3 core.
- Abstract(参考訳): 正確なリコール制御は、大規模な空間衝突やエンティティマッチングタスクにおいて重要であり、いくつかの真のマッチが欠落してもダウンストリーム分析を損なう可能性がある一方で、過剰な手作業によるレビューはコストを膨らませる。
Clopper-PearsonやWilsonのような古典的な信頼区間のカットはリコールのバウンダリを低くするが、彼らは定期的に数パーセントのポイントで目標をオーバーシュートし、歪んだスコア分布の下で高いラン・ツー・ラン分散を示す。
本稿では,数千万組の幾何対もの幾何学的ペアに対して,精度の低い精度で正確なリコールを実現するとともに,TPUに親しみやすいフレームワークを提案する。
我々のパイプラインは、平衡バウンディングボックスフィルタと圧縮スパース行(CSR)候補表現から始まり、2桁のペア列挙を削減した。
決定論的xxHashブートストラップサンプルは、軽量なニューラルランサーを訓練し、そのスコアは1つのフォワードパスを介して残りの全てのペアに伝播され、再現可能な、スコアが決定されたキャリブレーションセットを構築するのに使用される。
クロッパー・ピアソン、ジェフリーズ、ウィルソン、および正確な量子化の4つの補完しきい値推定器は、逆分散重み付けによって集約され、その後9つの独立したサブサンプルに融合する。
このアンサンブルは、どの方法よりも閾値のばらつきを減少させる。
2つの実カダストラルデータセット(約6.31Mと67.34Mペア)で評価され、我々のアプローチは小さなエラー内で常にリコールターゲットに到達し、他のキャリブレーションと比較して冗長な検証を減らし、1つのTPU v3コア上でエンドツーエンドに実行します。
関連論文リスト
- Distributed Training under Packet Loss [8.613477072763404]
信頼性の低いコネクションを利用するとレイテンシが低下するが、パケットを落としてモデルの精度と収束を犠牲にする可能性がある。
そこで本研究では,パケット損失の正確性と収束性を保証する原理的なエンドツーエンドソリューションを提案する。
この研究は、コミュニケーション効率の高いプロトコルと、現代の大規模モデルの訓練で要求される精度と保証のギャップを埋めるものである。
論文 参考訳(メタデータ) (2025-07-02T11:07:20Z) - Semiparametric conformal prediction [79.6147286161434]
ベクトル値の非整合性スコアの結合相関構造を考慮した共形予測セットを構築する。
スコアの累積分布関数(CDF)を柔軟に推定する。
提案手法は,現実の回帰問題に対して,所望のカバレッジと競争効率をもたらす。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Optimal Cross-Validation for Sparse Linear Regression [5.156484100374059]
線形回帰器のスパーシリティとロバスト性を選択するためにk-foldクロスバリデーションを用いる。
クロスバリデーションはスパース回帰の計算コストを大幅に増大させる。
混合整数最適化問題を50~80%削減することで、この状況を改善する。
論文 参考訳(メタデータ) (2023-06-26T17:02:45Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Sparse Feature Selection Makes Batch Reinforcement Learning More Sample
Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。
候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文 参考訳(メタデータ) (2020-11-08T16:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。