論文の概要: AgenticRS-EnsNAS: Ensemble-Decoupled Self-Evolving Architecture Search
- arxiv url: http://arxiv.org/abs/2603.20014v1
- Date: Fri, 20 Mar 2026 14:57:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.193316
- Title: AgenticRS-EnsNAS: Ensemble-Decoupled Self-Evolving Architecture Search
- Title(参考訳): AgenticRS-EnsNAS: Ensemble-Decoupled Self-Evolving Architecture Search
- Authors: Yun Chen, Moyu Zhang, Jinxin Hu, Yu Zhang, Xiaoyi Zeng,
- Abstract要約: この記事では、Ensemble-Decoupled Architecture Searchを紹介します。
シングルラーナー評価からシステムレベルの性能を予測する。
候補毎の検索コストをO(M)からO(1)に削減し、O(M)のデプロイメントコストは評価された勝者に限られる。
- 参考スコア(独自算出の注目度): 10.111487060179252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural Architecture Search (NAS) deployment in industrial production systems faces a fundamental validation bottleneck: verifying a single candidate architecture pi requires evaluating the deployed ensemble of M models, incurring prohibitive O(M) computational cost per candidate. This cost barrier severely limits architecture iteration frequency in real-world applications where ensembles (M=50-200) are standard for robustness. This work introduces Ensemble-Decoupled Architecture Search, a framework that leverages ensemble theory to predict system-level performance from single-learner evaluation. We establish the Ensemble-Decoupled Theory with a sufficient condition for monotonic ensemble improvement under homogeneity assumptions: a candidate architecture pi yields lower ensemble error than the current baseline if rho(pi) < rho(pi_old) - (M / (M - 1)) * (Delta E(pi) / sigma^2(pi)), where Delta E, rho, and sigma^2 are estimable from lightweight dual-learner training. This decouples architecture search from full ensemble training, reducing per-candidate search cost from O(M) to O(1) while maintaining O(M) deployment cost only for validated winners. We unify solution strategies across pipeline continuity: (1) closed-form optimization for tractable continuous pi (exemplified by feature bagging in CTR prediction), (2) constrained differentiable optimization for intractable continuous pi, and (3) LLM-driven search with iterative monotonic acceptance for discrete pi. The framework reveals two orthogonal improvement mechanisms -- base diversity gain and accuracy gain -- providing actionable design principles for industrial-scale NAS. All theoretical derivations are rigorous with detailed proofs deferred to the appendix. Comprehensive empirical validation will be included in the journal extension of this work.
- Abstract(参考訳): ひとつの候補アーキテクチャ piを検証するには、Mモデルのデプロイされたアンサンブルを評価し、候補毎のO(M)計算コストを禁ずる必要がある。
このコスト障壁は、アンサンブル(M=50-200)がロバストネスの標準である実世界のアプリケーションにおいて、アーキテクチャの反復頻度を著しく制限する。
この研究は、アンサンブル理論を利用してシングルラーナー評価からシステムレベルのパフォーマンスを予測するフレームワークであるEnsemble-Decoupled Architecture Searchを紹介する。
rho(pi) < rho(pi_old) - (M / (M − 1)) * (Delta E(pi) / sigma^2(pi)) ここで、Delta E, rho, および sigma^2 は軽量デュアルラーナートレーニングから推定可能である。
これにより、全アンサンブルトレーニングからアーキテクチャ検索を分離し、候補毎の検索コストをO(M)からO(1)に削減し、O(M)デプロイメントコストは評価された勝者に限られる。
我々は,パイプライン連続性における解戦略を統一する:(1) トラクタブル連続πに対する閉形式最適化(CTR予測における特徴バッジで例示される),(2) トラクタブル連続πに対する制約付き微分可能最適化,(3) 離散πに対する反復単調受容によるLCM駆動探索。
このフレームワークは、2つの直交的改善メカニズム、すなわち、基本多様性の獲得と精度の獲得を明らかにし、産業規模のNASに対して実行可能な設計原則を提供する。
すべての理論的導出は、付録に推論された詳細な証明と共に厳密である。
総合的な経験的検証は、この研究のジャーナル拡張に含まれます。
関連論文リスト
- A Theoretical Framework for Modular Learning of Robust Generative Models [41.69461814486466]
大規模生成モデルのトレーニングはリソース集約的であり、データセットの重み付けに大きく依存している。
本稿では,事前学習した専門家の集合をゲーティング機構を介して組み合わせたモジュラー生成モデリングの理論的枠組みを提案する。
モジュラーアーキテクチャは、競合を効果的に軽減し、モノリシックなベースラインを堅牢に上回ることを示す。
論文 参考訳(メタデータ) (2026-02-19T17:09:13Z) - Prism: Efficient Test-Time Scaling via Hierarchical Search and Self-Verification for Discrete Diffusion Language Models [96.0074341403456]
LLM推論を改善するための実用的な方法として、推論時計算が再導入されている。
テスト時間スケーリング(TTS)アルゴリズムの多くは、自動回帰デコーディングに依存している。
そこで我々は,dLLM のための効率的な TTS フレームワーク Prism を提案する。
論文 参考訳(メタデータ) (2026-02-02T09:14:51Z) - The 4/$δ$ Bound: Designing Predictable LLM-Verifier Systems for Formal Method Guarantee [5.345468714252351]
この研究は LLM-Verifier Convergence Theorem の開発によってギャップを埋める。
LLMと検証器の相互作用を離散時間マルコフ連鎖としてモデル化する。
われわれはこの予測を90,000件以上の治験を含む広範囲な実証キャンペーンでストレステストした。
論文 参考訳(メタデータ) (2025-11-30T22:19:09Z) - A2R: An Asymmetric Two-Stage Reasoning Framework for Parallel Reasoning [57.727084580884075]
モデルポテンシャルと実際の性能の間のギャップを埋めるために設計された非対称な2段階推論フレームワーク。
A2R-Efficientは、Qwen3-4BとQwen3-8Bシンセサイザーを組み合わせた「小型から大型」の派生型である。
その結果、A2Rはパフォーマンス・ブートスティングのフレームワークであるだけでなく、現実世界のアプリケーションに対して効率的かつ実用的なソリューションであることがわかった。
論文 参考訳(メタデータ) (2025-09-26T08:27:03Z) - MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources [113.33902847941941]
VAS (Variance-Aware Sampling) は、Variance Promotion Score (VPS) によって導かれるデータ選択戦略である。
我々は、1.6MのCoT冷間開始データと15kのRLQAペアを含む大規模かつ慎重にキュレートされたリソースをリリースする。
数学的推論ベンチマークによる実験では、キュレートされたデータと提案されたVASの有効性が示されている。
論文 参考訳(メタデータ) (2025-09-25T14:58:29Z) - SCoRE: Streamlined Corpus-based Relation Extraction using Multi-Label Contrastive Learning and Bayesian kNN [0.2812395851874055]
本稿では,モジュール型かつ費用対効果の高い文レベルの関係抽出システムであるSCoREを紹介する。
SCoREは簡単なPLMスイッチングを可能にし、微調整を必要とせず、多様なコーパスやKGにスムーズに適応する。
SCoREは, エネルギー消費を大幅に削減しつつ, 最先端の手法に適合するか, 超越しているかを示す。
論文 参考訳(メタデータ) (2025-07-09T14:33:07Z) - Pangu Embedded: An Efficient Dual-system LLM Reasoner with Metacognition [95.54406667705999]
Pangu Embeddedは、Ascend Neural Processing Units (NPU) 上で開発された効率的なLarge Language Model (LLM) 推論器である。
既存の推論最適化 LLM でよく見られる計算コストと推論遅延の問題に対処する。
単一の統一モデルアーキテクチャ内で、迅速な応答と最先端の推論品質を提供する。
論文 参考訳(メタデータ) (2025-05-28T14:03:02Z) - Theoretical Guarantees for LT-TTD: A Unified Transformer-based Architecture for Two-Level Ranking Systems [0.0]
LT-TTD (Listwise Transformer with Two-Tower Distillation) は、検索とランキングフェーズをブリッジする新しい統合アーキテクチャである。
LT-TTDは, 知識蒸留強度に依存する因子によって, 検索不可能な関連項目の上限を下げることを示す。
また、統一されたランキングアーキテクチャに特化して設計された新しい評価指標UPQEを紹介する。
論文 参考訳(メタデータ) (2025-05-07T14:01:22Z) - ZeroLM: Data-Free Transformer Architecture Search for Language Models [54.83882149157548]
現在の自動プロキシ発見アプローチは、検索時間の拡張、データの過度なオーバーフィットへの感受性、構造的な複雑さに悩まされている。
本稿では,効率的な重み統計によるモデルキャパシティの定量化を目的とした,新しいゼロコストプロキシ手法を提案する。
本評価は,FlexiBERT ベンチマークで Spearman's rho 0.76 と Kendall's tau 0.53 を達成し,このアプローチの優位性を示すものである。
論文 参考訳(メタデータ) (2025-03-24T13:11:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。