Fugu-MT 論文翻訳(概要): AdaExplore: Failure-Driven Adaptation and Diversity-Preserving Search for Efficient Kernel Generation

論文の概要: AdaExplore: Failure-Driven Adaptation and Diversity-Preserving Search for Efficient Kernel Generation

arxiv url: http://arxiv.org/abs/2604.16625v1
Date: Fri, 17 Apr 2026 18:25:03 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-21 21:52:52.110343
Title: AdaExplore: Failure-Driven Adaptation and Diversity-Preserving Search for Efficient Kernel Generation
Title（参考訳）: AdaExplore: 効率的なカーネル生成のための障害駆動型適応と多様性保護検索
Authors: Weihua Du, Jingming Zhuo, Yixin Dong, Andre Wang He, Weiwei Sun, Zeyu Zheng, Manupa Karunaratne, Ivan Fox, Tim Dettmers, Tianqi Chen, Yiming Yang, Sean Welleck,
Abstract要約: AdaExploreは、パフォーマンスクリティカルなカーネルコード生成のための蓄積された実行フィードバックによる自己改善を可能にするエージェントフレームワークである。適応段階では、エージェントはタスクを合成し、繰り返し発生する障害を有効ルールの再利用可能なメモリに変換する。探索段階では、候補核を木として整理し、小さな局所精製とより大きな構造再生を交互に行う。
参考スコア（独自算出の注目度）: 59.964989458924585
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent large language model (LLM) agents have shown promise in using execution feedback for test-time adaptation. However, robust self-improvement remains far from solved: most approaches still treat each problem instance independently, without accumulating reusable knowledge. This limitation is particularly pronounced in domain-specific languages such as Triton, which are underrepresented in LLM pretraining data. Their strict constraints and non-linear optimization landscape further make naive generation and local refinement unreliable. We propose AdaExplore, an agent framework that enables self-improvement via accumulated execution feedback for performance-critical kernel code generation through two complementary stages: failure-driven adaptation and diversity-preserving search, jointly improving correctness and optimization performance without additional fine-tuning or external knowledge. In the adaptation stage, the agent synthesizes tasks and converts recurring failures into a reusable memory of validity rules, helping subsequent generations remain within the feasible set. In the search stage, the agent organizes candidate kernels as a tree and alternates between small local refinements and larger structural regeneration, allowing it to explore the optimization landscape beyond local optima. Experiments on kernel runtime optimization benchmarks validate these gains: AdaExplore achieves 3.12x and 1.72x speedups on KernelBench Level-2 and Level-3, respectively, within 100 steps, and continues to improve with additional computation.
Abstract（参考訳）: 最近の大規模言語モデル (LLM) エージェントは、テスト時間適応に実行フィードバックを使うことを約束している。しかし、堅牢な自己改善は解決には程遠いものであり、ほとんどのアプローチは再利用可能な知識を蓄積することなく、各問題のインスタンスを独立して扱う。この制限は特に、LLM事前学習データに不足しているTritonのようなドメイン固有言語で顕著である。厳密な制約と非線形最適化の展望により、より単純な生成と局所的な洗練は信頼性を損なう。本稿では,AdaExploreを提案する。AdaExploreは,パフォーマンスクリティカルなカーネルコード生成のための蓄積された実行フィードバックによる自己改善を実現するエージェントフレームワークである。適応段階において、エージェントはタスクを合成し、繰り返し発生する障害を妥当性規則の再利用記憶に変換する。探索段階において、エージェントは候補カーネルを木として整理し、小さな局所的な精細化とより大きな構造的再生を交互に行い、局所最適を超えた最適化の展望を探索する。 AdaExploreはKernelBench Level-2とLevel-3でそれぞれ3.12倍と1.72倍のスピードアップを達成し、100ステップ以内で改善を続けています。

関連論文リスト

Subspace Optimization for Backpropagation-Free Continual Test-Time Adaptation [8.1094804369744]
PACEはバックプロパゲーションのない連続的なテスト時間適応システムである。正規化層のアフィンパラメータを直接最適化する。本フレームワークは,連続的な分散シフトの下で,複数のベンチマークにおいて最先端の精度を実現する。
論文参考訳（メタデータ） (2026-03-30T16:58:13Z)
Taming the Instability: A Robust Second-Order Optimizer for Federated Learning over Non-IID Data [77.19117648492104]
We present Federated Robust Curvature Optimization (FedRCO), a novel second-order optimization framework designed to improve convergence speed and reduce communication cost。 FedRCOは、効率的な近似曲率と証明可能な安定性メカニズムを統合することで、これらの課題に対処する。我々は,FedRCOが,最先端の1次法と2次法のどちらよりも高い精度と高速な収束を実現しつつ,多種多様な非IIDシナリオに対して優れたロバスト性を実現することを示す。
論文参考訳（メタデータ） (2026-03-30T11:37:46Z)
AdaEvolve: Adaptive LLM Driven Zeroth-Order Optimization [61.535567824938205]
本稿では,LLMによる進化を階層的適応最適化問題として再構成するフレームワークであるAdaEvolveを紹介する。 AdaEvolveは185の異なるオープンエンド最適化問題において、オープンエンドベースラインを一貫して上回っている。
論文参考訳（メタデータ） (2026-02-23T18:45:31Z)
AceGRPO: Adaptive Curriculum Enhanced Group Relative Policy Optimization for Autonomous Machine Learning Engineering [52.67783579040657]
AceGRPOは、エージェントの学習フロンティアにおけるタスクを優先順位付けして学習効率を最大化する機械学習システムである。我々のトレーニングされたAce-30Bモデルは、MLE-Bench-Lite上で100%有効な応募率を実現し、プロプライエタリなフロンティアモデルの性能にアプローチし、より大きなオープンソースベースラインを上回ります。
論文参考訳（メタデータ） (2026-02-08T10:55:03Z)
ContextEvolve: Multi-Agent Context Compression for Systems Code Optimization [8.046059974853858]
本稿では,厳密なパラメータブラインド制約の下でRLレベルの探索効率を実現するマルチエージェントフレームワークであるContextEvolveを紹介する。 ADRSベンチマークでは、ContextEvolveは最先端のベースラインを33.3%上回り、トークン消費を29.0%削減している。
論文参考訳（メタデータ） (2026-02-01T16:50:07Z)
Learning to Evolve with Convergence Guarantee via Neural Unrolling [37.99564850768798]
両レベルのメタ最適化フレームワークであるL2E(Learning to Evolve)を導入する。 L2Eは、KM(Krasnosel'skii-Mann)固定点理論に基づくニューラルアンローリング過程として進化探索を再構成する。実験では、高次元空間におけるL2Eのスケーラビリティと、合成および実世界の制御タスクにまたがる堅牢なゼロショット一般化が示される。
論文参考訳（メタデータ） (2025-12-12T10:46:25Z)
Generate, Discriminate, Evolve: Enhancing Context Faithfulness via Fine-Grained Sentence-Level Self-Evolution [61.80716438091887]
GenDiE (Generate, Discriminate, Evolve) は、微粒な文レベルの最適化によって文脈忠実性を高める新しい自己進化フレームワークである。応答中の各文を独立した最適化単位として扱うことで、GenDiEは以前のアプローチの限界に効果的に対処する。 ASQA(ドメイン内のLFQA)とConFiQAデータセットの実験は、GenDiEが忠実さと正しさの両方で様々なベースラインを超えることを示した。
論文参考訳（メタデータ） (2025-03-03T16:08:33Z)
A RankNet-Inspired Surrogate-Assisted Hybrid Metaheuristic for Expensive Coverage Optimization [5.757318591302855]
大規模カバレッジ最適化タスクを処理するために,RangeNetによるSurrogate支援ハイブリッドメタヒューリスティックを提案する。我々のアルゴリズムは、EMVOPの最先端アルゴリズムを一貫して上回っている。
論文参考訳（メタデータ） (2025-01-13T14:49:05Z)
Confident Adaptive Language Modeling [95.45272377648773]
CALMは、入力と生成時間ごとに異なる量の計算を動的に割り当てるフレームワークである。ハイパフォーマンスを確実に維持しつつ、計算能力、潜在的スピードアップを最大3ドルまで削減する上で、我々のフレームワークの有効性を実証する。
論文参考訳（メタデータ） (2022-07-14T17:00:19Z)
Static Neural Compiler Optimization via Deep Reinforcement Learning [1.458855293397494]
本稿では,位相整合問題に対する深層強化学習手法を用いる。 LLVMのO3シークエンスを構成するサブシーケンスを用いて、エージェントはトレーニングに使用するソースコードのセット上でO3シークエンスより優れていることを学習する。我々は、我々のアプローチを用いて訓練されたモデルは、ニューラル最適化エージェントとして現代のコンパイラに統合できると考えている。
論文参考訳（メタデータ） (2020-08-20T13:16:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。