論文の概要: Learning to Assess the Reliability of Number-of-Runs Estimation in Stochastic Optimization
- arxiv url: http://arxiv.org/abs/2605.28309v1
- Date: Wed, 27 May 2026 11:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.994077
- Title: Learning to Assess the Reliability of Number-of-Runs Estimation in Stochastic Optimization
- Title(参考訳): 確率最適化における実行回数推定の信頼性を評価するための学習
- Authors: Sara Gjorgjieva, Eva Tuba, Tome Eftimov,
- Abstract要約: 本研究では,近年のオンライン実験を学習ベースで拡張し,ハンドリングと歪度に基づく対称性チェックを用いて,必要な実行回数を適応的に推定する手法を提案する。
我々は,23個の統計量,エネルギーフリー,形状および安定性の分類器を訓練し,少数クラスのリコールによる誤推定の検出を優先し,ラン数推定が信頼できるかどうかを推定する。
その結果,不確実な推定値の信頼性を高いマイノリティクラスのリコールで検出できるが,固定構成におけるデータ多様性の制限により性能は制限されている。
- 参考スコア(独自算出の注目度): 3.9407886544063384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In large-scale benchmarking of stochastic optimization algorithms, the key challenge is no longer whether repeated runs are needed for reliability, but how to determine when sufficient evidence has been collected without incurring unnecessary computational cost. We study a learning-based extension of a recent empirical online heuristic that adaptively estimates the required number of runs using outlier handling and skewness-based symmetry checks. Using annotated outcomes from 132{,}000 Nevergrad runs on COCO (24 problems in 20 dimensions, 10 instances each, 11 optimizers), we train classifiers on 23 statistical, energy-free, and shape and stability features to predict whether a run-number estimate is reliable, prioritizing detection of incorrect estimates via minority-class recall. We evaluate reliability prediction using a within-configuration learning setup, where models are trained and tested on data sharing the same optimizer. The results show that run-number reliability can be learned in a within-configuration scenario, enabling detection of unreliable estimates with high minority-class recall, although performance remains limited by the restricted data diversity within fixed configurations.
- Abstract(参考訳): 確率最適化アルゴリズムの大規模ベンチマークでは、信頼性のために繰り返し実行する必要があるかどうかではなく、不要な計算コストを伴わずに十分な証拠が収集されたかどうかを判断する方法が課題である。
本研究では,最近の経験的オンラインヒューリスティックの学習に基づく拡張について検討し,外乱処理と歪度に基づく対称性チェックを用いて,必要な実行回数を適応的に推定する。
132{,}000 Nevergradの注釈付き結果を用いてCOCO(20次元で24の問題、各10のインスタンス、11のオプティマイザ)を学習し、23の統計量、エネルギー自由度、形状および安定性特性で分類器を訓練し、ラン数推定が信頼できるかどうかを予測し、少数クラスのリコールによる誤推定の検出を優先順位付けする。
我々は、モデルが同じオプティマイザのデータ共有に基づいてトレーニングされ、テストされる、構成内学習設定を用いて信頼性予測を評価する。
その結果,不確実な推定値の信頼性を高いマイノリティクラスのリコールで検出できるが,固定構成におけるデータ多様性の制限により性能は制限されている。
関連論文リスト
- Forecasting Multivariate Time Series under Predictive Heterogeneity: A Validation-Driven Clustering Framework [8.124770608442377]
統計的決定問題として適応プーリングを定式化する。
我々は,いつ,どのように専門化を適用すべきかを決定する検証駆動型フレームワークを提案する。
大規模トラフィックデータセットの実験では、強いベースラインよりも一貫した改善が示されている。
論文 参考訳(メタデータ) (2026-04-15T11:35:32Z) - A Realistic Evaluation of Cross-Frequency Transfer Learning and Foundation Forecasting Models [32.56983347493999]
大規模時系列データセットを事前トレーニング基礎予測モデル(FFM)にキュレートするための一般的なフレームワークとして、クロス周波数転送学習(CFTL)が登場している。
CFTLは将来性を示しているが、現在のベンチマークプラクティスは、そのパフォーマンスを正確に評価するに足らない。
この欠点は、小規模評価データセットへの過度な依存、計算サマリ統計におけるサンプルサイズの不適切な処理、最適以下の統計モデルの報告、事前トレーニングとテストデータセット間の重複の非無視的なリスクの考慮の欠如など、多くの要因に起因している。
論文 参考訳(メタデータ) (2025-09-23T18:19:50Z) - Semiparametric Learning from Open-Set Label Shift Data [14.537408547515627]
オープンセットラベルシフト問題について検討し、テストデータにはトレーニングに欠席した新しいクラスが含まれる可能性がある。
この設定は、クラス比率と新しいクラスの分布の両方が余分な仮定なしでは識別できないため、難しい。
本稿では,新しいクラスと既知のクラス間の重なりを許容しながら,識別可能性を保証する半パラメトリック密度比モデルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-18T01:32:29Z) - Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。