論文の概要: Crucible: Quantifying the Potential of Control Algorithms through LLM Agents
- arxiv url: http://arxiv.org/abs/2510.18491v1
- Date: Tue, 21 Oct 2025 10:25:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.426932
- Title: Crucible: Quantifying the Potential of Control Algorithms through LLM Agents
- Title(参考訳): Crucible: LLMエージェントによる制御アルゴリズムの可能性の定量化
- Authors: Lianchen Jia, Chaoyang Li, Qian Houde, Tianchi Huang, Jiangchuan Liu, Lifeng Sun,
- Abstract要約: アルゴリズムを変換し、それらのチューニングポテンシャルを定量的に評価するための定式化メトリックを定義するエージェントであるCrucibleを紹介する。
我々は、古典的な制御タスクから複雑なコンピュータシステムまで、幅広いケーススタディにおいてCrucibleの有効性を実証し、実世界の展開においてその結果を検証した。
Crucibleは、アルゴリズム分析と設計のための新しい次元を提供する。
- 参考スコア(独自算出の注目度): 21.61707571850866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Control algorithms in production environments typically require domain experts to tune their parameters and logic for specific scenarios. However, existing research predominantly focuses on algorithmic performance under ideal or default configurations, overlooking the critical aspect of Tuning Potential. To bridge this gap, we introduce Crucible, an agent that employs an LLM-driven, multi-level expert simulation to turn algorithms and defines a formalized metric to quantitatively evaluate their Tuning Potential. We demonstrate Crucible's effectiveness across a wide spectrum of case studies, from classic control tasks to complex computer systems, and validate its findings in a real-world deployment. Our experimental results reveal that Crucible systematically quantifies the tunable space across different algorithms. Furthermore, Crucible provides a new dimension for algorithm analysis and design, which ultimately leads to performance improvements. Our code is available at https://github.com/thu-media/Crucible.
- Abstract(参考訳): 実運用環境での制御アルゴリズムは、通常、特定のシナリオのためにパラメータやロジックを調整する必要がある。
しかし、既存の研究は主に、チューニングポテンシャルの重要な側面を見越して、理想的またはデフォルト構成下でのアルゴリズムのパフォーマンスに焦点を当てている。
このギャップを埋めるために、LLM駆動のマルチレベルエキスパートシミュレーションを用いてアルゴリズムを変換するエージェントであるCrucibleを導入し、そのチューニングポテンシャルを定量的に評価するための形式化されたメトリックを定義する。
我々は、古典的な制御タスクから複雑なコンピュータシステムまで、幅広いケーススタディにおいてCrucibleの有効性を実証し、実世界の展開においてその結果を検証した。
実験結果から、Crucibleは異なるアルゴリズムでチューナブル空間を体系的に定量化することがわかった。
さらに、Crucibleはアルゴリズム分析と設計のための新しいディメンションを提供し、最終的にパフォーマンスが向上する。
私たちのコードはhttps://github.com/thu-media/Crucible.comから入手可能です。
関連論文リスト
- Barbarians at the Gate: How AI is Upending Systems Research [58.95406995634148]
システム研究は、新しいパフォーマンス指向アルゴリズムの設計と評価に長年注力してきたが、AI駆動のソリューション発見には特に適している、と私たちは主張する。
このアプローチをAI駆動システム研究(ADRS)と呼び、ソリューションを反復的に生成し、評価し、洗練する。
我々の研究結果は、AI時代のシステム研究の実践に急激な適応の必要性と破壊的な可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-10-07T17:49:24Z) - XQC: Well-conditioned Optimization Accelerates Deep Reinforcement Learning [26.063477716451512]
我々は,ソフトアクター・クリティックをベースとした,よく動機付けられた,サンプル効率の高いディープアクター・クリティックアルゴリズムであるXQCを紹介する。
55のプロプリセプションと15の視覚に基づく連続制御タスクにまたがる最先端のサンプル効率を実現する。
論文 参考訳(メタデータ) (2025-09-29T17:58:53Z) - Benchmarking Optimization Algorithms for Automated Calibration of Quantum Devices [0.0347577906896546]
本稿では,量子デバイスの校正のための最適化アルゴリズムの総合的な研究結果を紹介する。
我々のベンチマークには、Nelder-Meadや最先端のCovariance Matrix Adaptation Evolution Strategy (CMA-ES)のような広く使われているアルゴリズムが含まれている。
この結果に基づき,CMA-ESアルゴリズムを推奨し,全てのテストシナリオにおいて優れた性能を示す実証的証拠を提供する。
論文 参考訳(メタデータ) (2025-09-10T13:00:40Z) - RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models [53.571195477043496]
本稿では,RoSTE (Rotated Straight-Through-Estimator) というアルゴリズムを提案する。
RoSTEは、量子化を意識した微調整(QA-SFT)と適応的な回転戦略を組み合わせることで、アクティベーションアウトリーを減少させる。
その結果, 予測誤差は収束重みの量子化誤差と直接比例し, 最適化された回転構成により効果的に管理できることが判明した。
論文 参考訳(メタデータ) (2025-02-13T06:44:33Z) - EVOLvE: Evaluating and Optimizing LLMs For In-Context Exploration [76.66831821738927]
大規模言語モデル(LLM)は、不確実性の下で最適な意思決定を必要とするシナリオにおいて、未調査のままである。
多くのアプリケーションに関係のあるステートレス強化学習環境である,帯域幅を最適に決定できる LLM の (in) 能力の測定を行う。
最適な探索アルゴリズムの存在を動機として,このアルゴリズム知識をLLMに統合する効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-08T17:54:03Z) - Designing Algorithms Empowered by Language Models: An Analytical Framework, Case Studies, and Insights [86.06371692309972]
本研究では,大規模言語モデル(LLM)に基づくアルゴリズムの設計と解析のための分析フレームワークを提案する。
提案する枠組みは頭痛を緩和する試みとして機能する。
論文 参考訳(メタデータ) (2024-07-20T07:39:07Z) - Hyperparameters in Continual Learning: A Reality Check [53.30082523545212]
連続学習(CL)は、可塑性(新しいタスクを学ぶ)と安定性(事前知識を保持する)のトレードオフをバランスしながら、一連のタスクでモデルを訓練することを目的としている。
論文 参考訳(メタデータ) (2024-03-14T03:13:01Z) - Can LLMs Configure Software Tools [0.76146285961466]
ソフトウェア工学では、複雑なシステム内での最適なパフォーマンスを確保するためには、ソフトウェアツールの精巧な構成が不可欠である。
本研究では,Large-Language Models (LLMs) を利用したソフトウェア構成プロセスの合理化について検討する。
本研究は,Chat-GPTなどのLCMを用いて,開始条件を特定し,検索空間を狭め,構成効率を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T05:03:02Z) - Benchmarking Actor-Critic Deep Reinforcement Learning Algorithms for
Robotics Control with Action Constraints [9.293472255463454]
本研究では,行動制約付き強化学習(RL)アルゴリズムの評価のためのベンチマークを提案する。
複数のロボット制御環境にまたがる既存のアルゴリズムとその新しい変種を評価する。
論文 参考訳(メタデータ) (2023-04-18T05:45:09Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - An Actor-Critic Method for Simulation-Based Optimization [6.261751912603047]
実現可能な空間から最適な設計を選択するためのシミュレーションに基づく最適化問題に焦点をあてる。
政策探索問題としてサンプリングプロセスを定式化し、強化学習(RL)の観点から解を求める。
いくつかの実験は提案アルゴリズムの有効性を検証するために設計されている。
論文 参考訳(メタデータ) (2021-10-31T09:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。