論文の概要: Eureka: Intelligent Feature Engineering for Enterprise AI Cloud Resource Demand Prediction
- arxiv url: http://arxiv.org/abs/2605.25297v2
- Date: Wed, 27 May 2026 18:29:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:54.637095
- Title: Eureka: Intelligent Feature Engineering for Enterprise AI Cloud Resource Demand Prediction
- Title(参考訳): Eureka: エンタープライズAIクラウドリソース需要予測のためのインテリジェントな機能エンジニアリング
- Authors: Hangxuan Li, Renjun Jia, Xuezhang Wu, Yunjie Qian, Zeqi Zheng, Xianling Zhang,
- Abstract要約: 本稿では,予測モデル性能のためのエージェントコード生成フレームワークであるEurekaを紹介する。
Eurekaには、Expert Agent、Feature Factory、Self-Evolving Alignment Engineの3つのステージがある。
Eurekaは、医療、金融、社会ドメインの7つの公開ベンチマークにおいて、AutoFEとLLMベースのベースラインを一貫して上回っている。
- 参考スコア(独自算出の注目度): 2.101720002743541
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Effective features are crucial for predictive model performance, but creating them often requires domain expertise, limiting scalability across applications. We define feature engineering as an agentic code generation problem: features are not static data transformations, but executable programs that can be generated, evaluated, and iteratively improved. We present Eureka, an LLM-driven framework with three stages. (1) An Expert Agent, fine-tuned via SFT on domain knowledge, produces structured feature design plans in JSON format. (2) An LLM Feature Factory translates each plan into executable Python code through chain-of-thought reasoning, turning feature hypotheses into runnable programs. (3) A Self-Evolving Alignment Engine uses Reinforcement Learning (GRPO) with dual-channel reward (metric-based utility + semantic alignment) to enhance code quality. By expressing features as programs, the learned generation patterns can transfer across domains. Evaluated on 7 public benchmarks in healthcare, finance, and social domains, Eureka consistently outperforms both traditional AutoFE and LLM-based baselines. We further demonstrate Eureka's effectiveness on cloud GPU resource demand prediction at Alibaba Cloud, where Eureka improves demand fulfillment rate by 16% and lowers computing resource migration rates by 33%.
- Abstract(参考訳): 効果的な機能は予測モデルのパフォーマンスに不可欠ですが、それらを作成するにはドメインの専門知識が必要で、アプリケーション間のスケーラビリティが制限されます。
機能は静的データ変換ではなく、生成、評価、反復的に改善できる実行可能プログラムである。
LLM駆動型フレームワークであるEurekaを3つのステージで紹介する。
1) ドメイン知識をSFTで微調整したエキスパートエージェントは、JSON形式で構造化された機能設計計画を生成する。
2) LLM Feature Factoryは、各プランをチェーンオブソート推論を通じて実行可能なPythonコードに変換し、機能仮説を実行可能なプログラムに変換する。
(3) 自己進化型アライメントエンジンは、コード品質を向上させるために、二重チャネル報酬(メトリックベースのユーティリティとセマンティックアライメント)を備えた強化学習(GRPO)を使用します。
関数をプログラムとして表現することで、学習した生成パターンがドメイン間で転送される。
医療、金融、社会ドメインの7つの公開ベンチマークに基づいて評価されたEurekaは、従来のAutoFEとLLMベースのベースラインを一貫して上回っている。
さらに、Alibaba CloudにおけるEurekaのクラウドGPUリソース需要予測における効果について、Eurekaは需要達成率を16%改善し、コンピューティングリソース移行率を33%下げる。
関連論文リスト
- From Insight to Action: A Novel Framework for Interpretability-Guided Data Selection in Large Language Models [73.72877445629383]
Interpretability-Guided Data Selection (IGDS) は、まず周波数リコールと干渉フィルタリングによって因果タスクの特徴を識別するフレームワークである。
我々は,数学的推論,要約,翻訳タスクに関するIGDSをGemma-2,LLaMA-3.1,Qwen3モデルで検証する。
論文 参考訳(メタデータ) (2026-04-28T03:16:24Z) - Revisiting Quantum Code Generation: Where Should Domain Knowledge Live? [0.0]
本稿では,Qiskit-HumanEvalベンチマークを用いて,Qiskitコード生成のための特殊化戦略について検討する。
現代の汎用LLMはパラメータ特化ベースラインを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2026-03-23T16:46:39Z) - AceGRPO: Adaptive Curriculum Enhanced Group Relative Policy Optimization for Autonomous Machine Learning Engineering [52.67783579040657]
AceGRPOは、エージェントの学習フロンティアにおけるタスクを優先順位付けして学習効率を最大化する機械学習システムである。
我々のトレーニングされたAce-30Bモデルは、MLE-Bench-Lite上で100%有効な応募率を実現し、プロプライエタリなフロンティアモデルの性能にアプローチし、より大きなオープンソースベースラインを上回ります。
論文 参考訳(メタデータ) (2026-02-08T10:55:03Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - AgentMath: Empowering Mathematical Reasoning for Large Language Models via Tool-Augmented Agent [80.83250816918861]
o3やDeepSeek-R1のようなLarge Reasoning Models (LRM)は、長いチェーン・オブ・シークレットを持つ自然言語推論において顕著な進歩を遂げている。
しかし、計算的に非効率であり、複雑な数学的操作を必要とする問題を解く際には精度に苦しむ。
本稿では,言語モデルの推論能力とコードインタプリタの計算精度をシームレスに統合するエージェントフレームワークであるAgentMathを紹介する。
論文 参考訳(メタデータ) (2025-12-23T19:57:49Z) - CodeLSI: Leveraging Foundation Models for Automated Code Generation with Low-Rank Optimization and Domain-Specific Instruction Tuning [7.859346610442163]
本稿では,低ランク最適化とドメイン固有命令チューニングを組み合わせたフレームワークであるCodeLSIを紹介する。
本研究の目的は、特定のドメインに適した高品質なコードを生成するための新しいアプローチであるCodeLSIを開発し、評価することである。
論文 参考訳(メタデータ) (2025-09-17T19:20:23Z) - A Survey on Code Generation with LLM-based Agents [61.474191493322415]
大規模言語モデル(LLM)を利用したコード生成エージェントは、ソフトウェア開発パラダイムに革命をもたらしている。
LLMは3つのコア特徴によって特徴づけられる。
本稿では,LLMに基づくコード生成エージェントの分野を体系的に調査する。
論文 参考訳(メタデータ) (2025-07-31T18:17:36Z) - Evaluating Large Language Models on Non-Code Software Engineering Tasks [4.381476817430934]
大規模言語モデル(LLM)は、コード理解と生成において顕著な能力を示している。
ソフトウェア工学言語理解(SELU)と呼ばれる最初の包括的なベンチマークを提示する。
SELUは、分類、回帰、名前付きエンティティ認識(NER)とマスケッド言語モデリング(MLM)のターゲットをカバーし、さまざまなソースからデータを引き出す。
論文 参考訳(メタデータ) (2025-06-12T15:52:32Z) - SENAI: Towards Software Engineering Native Generative Artificial Intelligence [3.915435754274075]
本稿では,ソフトウェア工学の知識を大規模言語モデルに統合することについて議論する。
本研究の目的は,LLMが単なる機能的精度を超えて生成タスクを実行できる新しい方向を提案することである。
ソフトウェアエンジニアリング ネイティブな生成モデルは、現在のモデルに存在する欠点を克服するだけでなく、現実世界のソフトウェアエンジニアリングを扱うことができる次世代の生成モデルへの道を開くでしょう。
論文 参考訳(メタデータ) (2025-03-19T15:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。