論文の概要: Tool-Augmented Agent for Closed-loop Optimization,Simulation,and Modeling Orchestration
- arxiv url: http://arxiv.org/abs/2605.20190v1
- Date: Wed, 01 Apr 2026 14:14:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.953504
- Title: Tool-Augmented Agent for Closed-loop Optimization,Simulation,and Modeling Orchestration
- Title(参考訳): 閉ループ最適化・シミュレーション・モデリングのためのツール強化エージェント
- Authors: Liyuan Deng, Shujian Deng, Yongkang Chen, Yongkang Dai, Zhihang Zhong, Linyang Li, Xiao Sun, Yilei Shi, Huaxi Huang,
- Abstract要約: COSMO-Agentは、LCMに閉ループCAD-CAEプロセスを完成させるように教えるツール強化強化学習フレームワークである。
我々は、実現可能性、ツールチェーンの堅牢性、構造化された出力妥当性を共同で促進するマルチ制約パラメトリック報酬を設計する。
COSMO-Agent トレーニングは制約駆動設計のための小さなオープンソース LLM を大幅に改善することを示した。
- 参考スコア(独自算出の注目度): 26.690772733565996
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Iterative industrial design-simulation optimization is bottlenecked by the CAD-CAE semantic gap: translating simulation feedback into valid geometric edits under diverse, coupled constraints. To fill this gap, we propose COSMO-Agent (Closed-loop Optimization, Simulation, and Modeling Orchestration), a tool-augmented reinforcement learning (RL) framework that teaches LLMs to complete the closed-loop CAD-CAE process. Specifically, we cast CAD generation, CAE solving, result parsing, and geometry revision as an interactive RL environment, where an LLM learns to orchestrate external tools and revise parametric geometries until constraints are satisfied. To make this learning stable and industrially usable, we design a multi-constraint reward that jointly encourages feasibility, toolchain robustness, and structured output validity. In addition, we contribute an industry-aligned dataset that covers 25 component categories with executable CAD-CAE tasks to support realistic training and evaluation. Experiments show that COSMO-Agent training substantially improves small open-source LLMs for constraint-driven design, exceeding large open-source and strong closed-source models in feasibility, efficiency, and stability.
- Abstract(参考訳): 反復的工業設計シミュレーション最適化はCAD-CAEセマンティックギャップによってボトルネックとなる。
このギャップを埋めるために,ツール強化強化学習(RL)フレームワークであるCOSMO-Agent(Closed-loop Optimization, Simulation, and Modeling Orchestration)を提案する。
具体的には、CAD生成、CAE解決、結果解析、幾何修正をインタラクティブなRL環境とし、LCMは制約を満たすまで外部ツールのオーケストレーションとパラメトリックジオメトリの修正を学習する。
この学習を安定し、産業的に利用できるようにするため、我々は、実現可能性、ツールチェーンの堅牢性、構造化された出力妥当性を共同で促進するマルチ制約報酬を設計する。
さらに,本研究は,現実的なトレーニングと評価を支援するために,実行可能なCAD-CAEタスクを備えた25のコンポーネントカテゴリをカバーする,業界対応のデータセットを寄贈する。
実験により、COSMO-Agentトレーニングは制約駆動設計のための小さなオープンソース LLM を大幅に改善し、実現可能性、効率、安定性において大きなオープンソースおよび強力なクローズドソースモデルを上回ることが示されている。
関連論文リスト
- Memory-Augmented Reinforcement Learning Agent for CAD Generation [3.787730810941452]
本稿では,CAD生成エージェントのためのメモリ拡張型強化学習フレームワークを提案する。
このフレームワークは、基盤となる幾何学的カーネルを、エージェントによって呼び出し可能な構造化ツールチェーンにカプセル化する。
実験により,提案手法は複雑なCADモデル生成タスクにおける成功率と幾何整合性の両方を著しく改善することが示された。
論文 参考訳(メタデータ) (2026-05-19T12:16:31Z) - COSMO-Agent: Tool-Augmented Agent for Closed-loop Optimization,Simulation,and Modeling Orchestration [26.690772733565996]
COSMO-Agentは、LCMに閉ループCAD-CAEプロセスを完成させるように教えるツール強化強化学習フレームワークである。
我々は、実現可能性、ツールチェーンの堅牢性、構造化された出力妥当性を共同で促進するマルチ制約パラメトリック報酬を設計する。
COSMO-Agent トレーニングは制約駆動設計のための小さなオープンソース LLM を大幅に改善することを示した。
論文 参考訳(メタデータ) (2026-04-07T07:45:17Z) - Execution-Verified Reinforcement Learning for Optimization Modeling [49.171122807323634]
実行検証学習フレームワークは、数学的プログラミング解法を決定論的で対話的な検証器として扱う。
NL4OPT, MAMO, IndustryOR, OptiBenchをグロビ, OR-Tools, COPTで行った実験では, EVOMがプロセス管理SFTに適合または優れていた。
論文 参考訳(メタデータ) (2026-04-01T03:39:11Z) - VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use [78.29315418819074]
VerlToolは、体系的な設計原則を通じて制限に対処する統一的でモジュール化されたフレームワークです。
我々のフレームワークはARLTをマルチターントラジェクトリとして定式化し、マルチモード観測トークン(テキスト/画像/ビデオ)を単一ターンRLVRパラダイムを超えて拡張する。
モジュール化されたプラグインアーキテクチャは、軽量Python定義のみを必要とする迅速なツール統合を可能にする。
論文 参考訳(メタデータ) (2025-09-01T01:45:18Z) - From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.67703214044401]
CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-08-13T18:30:49Z) - Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments [70.42705564227548]
大規模言語モデル(LLM)のための環境自動構築パイプラインを提案する。
これにより、外部ツールに頼ることなく、詳細な測定可能なフィードバックを提供する高品質なトレーニング環境の作成が可能になる。
また、ツール使用の精度とタスク実行の完全性の両方を評価する検証可能な報酬機構も導入する。
論文 参考訳(メタデータ) (2025-08-12T09:45:19Z) - Generative AI for CAD Automation: Leveraging Large Language Models for 3D Modelling [31.94035963354055]
大規模言語モデル(LLM)は、効率性、スケーラビリティ、革新性を向上させることで産業に革命をもたらしている。
本稿では,フリーCAD と LLM をCAD ツールとして統合することにより,CAD の自動設計における LLM の可能性を検討する。
本稿では,LLMが自然言語記述からCADスクリプトを生成するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-05T23:30:17Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。