論文の概要: AutoSG: LLM-Driven Solver Generation Solely from Task Prompts for Expensive Optimization
- arxiv url: http://arxiv.org/abs/2605.25658v1
- Date: Mon, 25 May 2026 10:04:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.640227
- Title: AutoSG: LLM-Driven Solver Generation Solely from Task Prompts for Expensive Optimization
- Title(参考訳): AutoSG: LLM-Driven Solver Generation Solely from Task Prompts for Expensive Optimization
- Authors: Haoran Gu, Handing Wang, Yi Mei, Mengjie Zhang,
- Abstract要約: AutoSGは、自然言語プロンプトを直接実行可能なカスタマイズされたソルバに翻訳する完全に自動化されたワークフローである。
AutoSGは3つのコアイノベーションを特徴としている。検索拡張ソルバ生成モジュールは、検証済み文献のコードを厳格に基礎づけている。
- 参考スコア(独自算出の注目度): 11.066280731240818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Expensive optimization tasks are ubiquitous in real-world applications, demanding highly specialized solvers. While LLM-driven automated solver generation shows promise, current paradigms face three critical issues when tackling expensive optimization: factual hallucinations due to deficient domain knowledge, the frequent dismantling of previously established locally optimal structures during refinement, and the prohibitive evaluation costs alongside restricted generalization caused by executing on training instances. To address these issues, we introduce AutoSG, a fully automated workflow directly translating natural language prompts into executable customized solvers. AutoSG features three core innovations: a retrieval-augmented solver generation module strictly grounding code in verified literature; a one-step self-refinement operator introducing task-specific improvements while preserving critical structural components; and an instance-free Elo-based LLM-as-a-Judge evaluation mechanism rapidly establishing global rankings. Extensive evaluations across diverse expensive optimization tasks confirm AutoSG significantly outperforms human-designed state-of-the-art frameworks and existing LLM-generated solvers.
- Abstract(参考訳): 膨大な最適化タスクは、現実世界のアプリケーションではユビキタスであり、高度に専門化された解法を必要とする。
LLMによる自動解凍器生成は有望である一方で、現在のパラダイムでは、ドメイン知識の不足による事実の幻覚、改善中の局所的な最適構造の頻繁な分解、トレーニングインスタンスの実行による一般化の制限に伴う禁止的評価コストの3つの重要な問題に直面している。
これらの問題に対処するため、我々は、自然言語プロンプトを直接実行可能なカスタマイズされたソルバに翻訳する完全に自動化されたワークフローであるAutoSGを紹介した。
AutoSGは3つのコアイノベーションを特徴としている: 検索強化ソルバ生成モジュールは、検証済み文献のコードを厳格に基礎づけている; 重要な構造コンポーネントを保持しながらタスク固有の改善を導入する1ステップのセルフリファインメント演算子; グローバルランキングを急速に確立するインスタンスレスエロベースのLCM-as-Judge評価機構。
多様な高価な最適化タスクに対する広範囲な評価により、AutoSGは人間の設計した最先端フレームワークや既存のLLM生成解決ツールよりも大幅に優れていることが確認された。
関連論文リスト
- Execution-Verified Reinforcement Learning for Optimization Modeling [49.171122807323634]
実行検証学習フレームワークは、数学的プログラミング解法を決定論的で対話的な検証器として扱う。
NL4OPT, MAMO, IndustryOR, OptiBenchをグロビ, OR-Tools, COPTで行った実験では, EVOMがプロセス管理SFTに適合または優れていた。
論文 参考訳(メタデータ) (2026-04-01T03:39:11Z) - Rethinking LLM-Driven Heuristic Design: Generating Efficient and Specialized Solvers via Dynamics-Aware Optimization [21.449921296295884]
本研究では,コンバージェンス・アウェア・ヒューリスティックス(DASH, Dynamics-Aware Heuristics)を提案する。
DASHは、さまざまな問題スケールにわたる最先端のベースラインのソリューション品質を越えながら、ランタイム効率を3倍以上改善します。
論文 参考訳(メタデータ) (2026-01-14T05:06:42Z) - OPT-Engine: Benchmarking the Limits of LLMs in Optimization Modeling via Complexity Scaling [13.57588221678224]
大規模言語モデル(LLM)は、最適化モデリングの驚くべき進歩を示している。
自動定式化と問題解決におけるそれらの能力の境界は、まだよく理解されていない。
OPT-ENGINEは、制御可能でスケーラブルな難易度を持つ最適化モデルにおいて、LCMを評価するために設計されたベンチマークフレームワークである。
論文 参考訳(メタデータ) (2026-01-09T09:22:33Z) - A Survey of LLM-based Automated Program Repair: Taxonomies, Design Paradigms, and Applications [12.409034344742768]
大規模言語モデル (LLM) は自動プログラム修復 (APR) を再構築している
我々は2022年1月から2025年6月までに発行された63 LLMベースのAPRシステムを4つのパラダイムに分類した。
微調整は高いトレーニングコストで強力なタスクアライメントを提供する。迅速なデプロイメントを可能にするが、迅速な設計とコンテキストウィンドウによって制限される。
我々は,軽量な人的フィードバック,リポジトリ対応検索,コード解析,コスト対応計画を組み合わせることで,信頼性と効率的なLDMベースのAPRを向上する研究の方向性を概説する。
論文 参考訳(メタデータ) (2025-06-30T11:46:01Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - LADs: Leveraging LLMs for AI-Driven DevOps [3.240228178267042]
LADは、どの条件の下で最適化が機能するかを詳細に分析することで、構成最適化の原則化されたアプローチである。
Retrieval-Augmented Generation、Few-Shot Learning、Chain-of-Thought、Feedback-Based Prompt Chainingを活用することで、LADは正確な構成を生成し、デプロイメント障害から反復的に洗練されたシステム設定を学ぶ。
我々の発見は、パフォーマンス、コスト、スケーラビリティのトレードオフに関する重要な洞察を明らかにし、実践者が異なるデプロイメントシナリオに対して適切な戦略を決定するのに役立つ。
論文 参考訳(メタデータ) (2025-02-28T08:12:08Z) - IMPROVE: Iterative Model Pipeline Refinement and Optimization Leveraging LLM Experts [28.9807389592324]
機械学習のワークフローを自動化するための有望なソリューションとして、大規模言語モデル(LLM)エージェントが登場した。
LLM駆動のMLパイプライン設計のための新しい戦略であるIterative Refinementを紹介します。
実際のトレーニングフィードバックに基づいて個々のコンポーネントを体系的に更新することにより、イテレーティブリファインメントはモデル全体のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2025-02-25T01:52:37Z) - Dynamic Rewarding with Prompt Optimization Enables Tuning-free Self-Alignment of Language Models [54.381650481255235]
我々は,Prompt Optimization (O) を用いた動的リワードによる自己アライメントのための新しいチューニング不要アプローチを提案する。
提案手法は,LLMを反復的に自己改善し,最適アライメント命令を作成可能な検索ベース最適化フレームワークを活用する。
近年の8つのLCMのオープンおよびクローズドソースに関する実証評価により,DRPOはアライメント性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-11-13T16:15:38Z) - Autoformulation of Mathematical Optimization Models Using LLMs [50.030647274271516]
本稿では,自然言語問題記述から解法対応最適化モデルを自動生成する,$textitautoformulation$の問題にアプローチする。
オートフォーミュレーションの3つの主要な課題を識別する: $textit(1)$ 巨大で問題に依存した仮説空間、および$textit(2)$ 不確実性の下でこの空間を効率的かつ多様に探索する。
我々は,$textitLarge Language Models$と$textitMonte-Carlo Tree Search$を併用した新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-03T20:41:38Z) - Auto-PRE: An Automatic and Cost-Efficient Peer-Review Framework for Language Generation Evaluation [52.76508734756661]
Auto-PREはピアレビュープロセスにインスパイアされた自動評価フレームワークである。
人間のアノテーションに依存する従来のアプローチとは異なり、Auto-PREは自動的に3つのコア特性に基づいて評価子を選択する。
要約,非ファクトイドQA,対話生成を含む3つの代表的なタスクの実験は,Auto-PREが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-10-16T06:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。