論文の概要: Crucible: Quantifying the Potential of Control Algorithms through LLM Agents
- arxiv url: http://arxiv.org/abs/2510.18491v1
- Date: Tue, 21 Oct 2025 10:25:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.426932
- Title: Crucible: Quantifying the Potential of Control Algorithms through LLM Agents
- Title(参考訳): Crucible: LLMエージェントによる制御アルゴリズムの可能性の定量化
- Authors: Lianchen Jia, Chaoyang Li, Qian Houde, Tianchi Huang, Jiangchuan Liu, Lifeng Sun,
- Abstract要約: アルゴリズムを変換し、それらのチューニングポテンシャルを定量的に評価するための定式化メトリックを定義するエージェントであるCrucibleを紹介する。
我々は、古典的な制御タスクから複雑なコンピュータシステムまで、幅広いケーススタディにおいてCrucibleの有効性を実証し、実世界の展開においてその結果を検証した。
Crucibleは、アルゴリズム分析と設計のための新しい次元を提供する。
- 参考スコア(独自算出の注目度): 21.61707571850866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Control algorithms in production environments typically require domain experts to tune their parameters and logic for specific scenarios. However, existing research predominantly focuses on algorithmic performance under ideal or default configurations, overlooking the critical aspect of Tuning Potential. To bridge this gap, we introduce Crucible, an agent that employs an LLM-driven, multi-level expert simulation to turn algorithms and defines a formalized metric to quantitatively evaluate their Tuning Potential. We demonstrate Crucible's effectiveness across a wide spectrum of case studies, from classic control tasks to complex computer systems, and validate its findings in a real-world deployment. Our experimental results reveal that Crucible systematically quantifies the tunable space across different algorithms. Furthermore, Crucible provides a new dimension for algorithm analysis and design, which ultimately leads to performance improvements. Our code is available at https://github.com/thu-media/Crucible.
- Abstract(参考訳): 実運用環境での制御アルゴリズムは、通常、特定のシナリオのためにパラメータやロジックを調整する必要がある。
しかし、既存の研究は主に、チューニングポテンシャルの重要な側面を見越して、理想的またはデフォルト構成下でのアルゴリズムのパフォーマンスに焦点を当てている。
このギャップを埋めるために、LLM駆動のマルチレベルエキスパートシミュレーションを用いてアルゴリズムを変換するエージェントであるCrucibleを導入し、そのチューニングポテンシャルを定量的に評価するための形式化されたメトリックを定義する。
我々は、古典的な制御タスクから複雑なコンピュータシステムまで、幅広いケーススタディにおいてCrucibleの有効性を実証し、実世界の展開においてその結果を検証した。
実験結果から、Crucibleは異なるアルゴリズムでチューナブル空間を体系的に定量化することがわかった。
さらに、Crucibleはアルゴリズム分析と設計のための新しいディメンションを提供し、最終的にパフォーマンスが向上する。
私たちのコードはhttps://github.com/thu-media/Crucible.comから入手可能です。
関連論文リスト
- Benchmarking Optimization Algorithms for Automated Calibration of Quantum Devices [0.0347577906896546]
本稿では,量子デバイスの校正のための最適化アルゴリズムの総合的な研究結果を紹介する。
我々のベンチマークには、Nelder-Meadや最先端のCovariance Matrix Adaptation Evolution Strategy (CMA-ES)のような広く使われているアルゴリズムが含まれている。
この結果に基づき,CMA-ESアルゴリズムを推奨し,全てのテストシナリオにおいて優れた性能を示す実証的証拠を提供する。
論文 参考訳(メタデータ) (2025-09-10T13:00:40Z) - Designing Algorithms Empowered by Language Models: An Analytical Framework, Case Studies, and Insights [86.06371692309972]
本研究では,大規模言語モデル(LLM)に基づくアルゴリズムの設計と解析のための分析フレームワークを提案する。
提案する枠組みは頭痛を緩和する試みとして機能する。
論文 参考訳(メタデータ) (2024-07-20T07:39:07Z) - Hyperparameters in Continual Learning: A Reality Check [53.30082523545212]
連続学習(CL)は、可塑性(新しいタスクを学ぶ)と安定性(事前知識を保持する)のトレードオフをバランスしながら、一連のタスクでモデルを訓練することを目的としている。
論文 参考訳(メタデータ) (2024-03-14T03:13:01Z) - Can LLMs Configure Software Tools [0.76146285961466]
ソフトウェア工学では、複雑なシステム内での最適なパフォーマンスを確保するためには、ソフトウェアツールの精巧な構成が不可欠である。
本研究では,Large-Language Models (LLMs) を利用したソフトウェア構成プロセスの合理化について検討する。
本研究は,Chat-GPTなどのLCMを用いて,開始条件を特定し,検索空間を狭め,構成効率を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T05:03:02Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。