論文の概要: Scalable branch-and-bound model selection with non-monotonic criteria including AIC, BIC and Mallows's $\mathit{C_p}$
- arxiv url: http://arxiv.org/abs/2512.12221v1
- Date: Sat, 13 Dec 2025 07:16:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.17188
- Title: Scalable branch-and-bound model selection with non-monotonic criteria including AIC, BIC and Mallows's $\mathit{C_p}$
- Title(参考訳): AIC、BIC、Mallowsの$\mathit{C_p}$を含む非単調な基準を持つスケーラブルなブランチ・バウンドモデル選択
- Authors: Jakob Vanhoefer, Antonia Körner, Domagoj Doresic, Jan Hasenauer, Dilan Pathirana,
- Abstract要約: 非単調関数に適した分岐とバウンドのアルゴリズムの開発を可能にする,単純だが斬新なバウンドを導入する。
提案手法は,多様なモデルクラス,サイズ,アプリケーションにまたがる最適モデルの同定を保証する。
- 参考スコア(独自算出の注目度): 1.3592625530347717
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model selection is a pivotal process in the quantitative sciences, where researchers must navigate between numerous candidate models of varying complexity. Traditional information criteria, such as the corrected Akaike Information Criterion (AICc), Bayesian Information Criterion (BIC), and Mallows's $\mathit{C_p}$, are valuable tools for identifying optimal models. However, the exponential increase in candidate models with each additional model parameter renders the evaluation of these criteria for all models -- a strategy known as exhaustive, or brute-force, searches -- computationally prohibitive. Consequently, heuristic approaches like stepwise regression are commonly employed, albeit without guarantees of finding the globally-optimal model. In this study, we challenge the prevailing notion that non-monotonicity in information criteria precludes bounds on the search space. We introduce a simple but novel bound that enables the development of branch-and-bound algorithms tailored for these non-monotonic functions. We demonstrate that our approach guarantees identification of the optimal model(s) across diverse model classes, sizes, and applications, often with orders of magnitude computational speedups. For instance, in one previously-published model selection task involving $2^{32}$ (approximately 4 billion) candidate models, our method achieves a computational speedup exceeding 6,000. These findings have broad implications for the scalability and effectiveness of model selection in complex scientific domains.
- Abstract(参考訳): モデル選択は定量的科学において重要なプロセスであり、研究者は様々な複雑さの候補モデルの間をナビゲートしなければならない。
修正されたAkaike Information Criterion (AICc)、Bayesian Information Criterion (BIC)、Mallowsの$\mathit{C_p}$といった伝統的な情報基準は最適なモデルを識別するための貴重なツールである。
しかし、各追加モデルパラメータによる候補モデルの指数的な増加は、全てのモデルに対するこれらの基準の評価を反映している。
その結果、ステップワイズ回帰のようなヒューリスティックなアプローチが一般的に採用されるが、世界最適モデルを見つける保証はない。
本研究では,情報基準の非単調性は検索空間の境界を妨げない,という一般的な概念に挑戦する。
我々は,これらの非単調関数に適した分岐とバウンドのアルゴリズムの開発を可能にする,単純だが斬新なバウンドを導入する。
提案手法は,様々なモデルクラス,サイズ,アプリケーションにまたがる最適モデルの同定を,計算速度の桁数で保証する。
例えば、約40億の候補モデルである$2^{32}$を含む以前に発表されたモデル選択タスクでは、計算速度が6,000を超える。
これらの知見は、複雑な科学領域におけるモデル選択のスケーラビリティと有効性に幅広い影響を及ぼす。
関連論文リスト
- Generalized Top-k Mallows Model for Ranked Choices [7.389630498367403]
本稿では,トップkのMallowsモデルに適した新しいサンプリングスキームと,選択確率を計算するための効率的なアルゴリズムを提案する。
また,観測された選択データからモデルパラメータを推定する能動的学習アルゴリズムを提案する。
これらの貢献は、重要な意思決定シナリオの分析と予測のための新しいツールを提供する。
論文 参考訳(メタデータ) (2025-10-24T21:49:21Z) - Automated Constitutive Model Discovery by Pairing Sparse Regression Algorithms with Model Selection Criteria [0.27998963147546146]
このフレームワークは、合成データセットと実験データセットの両方を利用して、等方性と異方性両方の超弾性に適用される。
その結果、9つのアルゴリズム-基準の組み合わせは、等方性および異方性物質を発見するのに一貫してうまく機能することが明らかとなった。
論文 参考訳(メタデータ) (2025-09-19T14:50:04Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - On Least Square Estimation in Softmax Gating Mixture of Experts [78.3687645289918]
決定論的MoEモデルに基づく最小二乗推定器(LSE)の性能について検討する。
我々は,多種多様な専門家関数の収束挙動を特徴付けるために,強い識別可能性という条件を確立する。
本研究は,専門家の選択に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-02-05T12:31:18Z) - Modeling Choice via Self-Attention [8.394221523847325]
注意に基づく選択モデルはHalo Multinomial Logit(Halo-MNL)モデルの低最適一般化であることを示す。
また、実データから選択を推定するための最初の現実的な尺度を確立し、既存のモデルの評価を行う。
論文 参考訳(メタデータ) (2023-11-11T11:13:07Z) - On Statistical Efficiency in Learning [37.08000833961712]
モデルフィッティングとモデル複雑性のバランスをとるためのモデル選択の課題に対処する。
モデルの複雑さを順次拡大し、選択安定性を高め、コストを削減するオンラインアルゴリズムを提案します。
実験の結果, 提案手法は予測能力が高く, 計算コストが比較的低いことがわかった。
論文 参考訳(メタデータ) (2020-12-24T16:08:29Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Learning Gaussian Graphical Models via Multiplicative Weights [54.252053139374205]
乗算重み更新法に基づいて,Klivans と Meka のアルゴリズムを適用した。
アルゴリズムは、文献の他のものと質的に類似したサンプル複雑性境界を楽しみます。
ランタイムが低い$O(mp2)$で、$m$サンプルと$p$ノードの場合には、簡単にオンライン形式で実装できる。
論文 参考訳(メタデータ) (2020-02-20T10:50:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。