論文の概要: COSMO-Agent: Tool-Augmented Agent for Closed-loop Optimization,Simulation,and Modeling Orchestration
- arxiv url: http://arxiv.org/abs/2604.05547v1
- Date: Tue, 07 Apr 2026 07:45:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.700728
- Title: COSMO-Agent: Tool-Augmented Agent for Closed-loop Optimization,Simulation,and Modeling Orchestration
- Title(参考訳): COSMO-Agent:クローズドループ最適化のためのツール強化エージェント、シミュレーション、モデリングオーケストレーション
- Authors: Liyuan Deng, Shujian Deng, Yongkang Chen, Yongkang Dai, Zhihang Zhong, Linyang Li, Xiao Sun, Yilei Shi, Huaxi Huang,
- Abstract要約: COSMO-Agentは、LCMに閉ループCAD-CAEプロセスを完成させるように教えるツール強化強化学習フレームワークである。
我々は、実現可能性、ツールチェーンの堅牢性、構造化された出力妥当性を共同で促進するマルチ制約パラメトリック報酬を設計する。
COSMO-Agent トレーニングは制約駆動設計のための小さなオープンソース LLM を大幅に改善することを示した。
- 参考スコア(独自算出の注目度): 26.690772733565996
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Iterative industrial design-simulation optimization is bottlenecked by the CAD-CAE semantic gap: translating simulation feedback into valid geometric edits under diverse, coupled constraints. To fill this gap, we propose COSMO-Agent (Closed-loop Optimization, Simulation, and Modeling Orchestration), a tool-augmented reinforcement learning (RL) framework that teaches LLMs to complete the closed-loop CAD-CAE process. Specifically, we cast CAD generation, CAE solving, result parsing, and geometry revision as an interactive RL environment, where an LLM learns to orchestrate external tools and revise parametric geometries until constraints are satisfied. To make this learning stable and industrially usable, we design a multi-constraint reward that jointly encourages feasibility, toolchain robustness, and structured output validity. In addition, we contribute an industry-aligned dataset that covers 25 component categories with executable CAD-CAE tasks to support realistic training and evaluation. Experiments show that COSMO-Agent training substantially improves small open-source LLMs for constraint-driven design, exceeding large open-source and strong closed-source models in feasibility, efficiency, and stability.
- Abstract(参考訳): 反復的工業設計シミュレーション最適化はCAD-CAEセマンティックギャップによってボトルネックとなる。
このギャップを埋めるために,ツール強化強化学習(RL)フレームワークであるCOSMO-Agent(Closed-loop Optimization, Simulation, and Modeling Orchestration)を提案する。
具体的には、CAD生成、CAE解決、結果解析、幾何修正をインタラクティブなRL環境とし、LCMは制約を満たすまで外部ツールのオーケストレーションとパラメトリックジオメトリの修正を学習する。
この学習を安定し、産業的に利用できるようにするため、我々は、実現可能性、ツールチェーンの堅牢性、構造化された出力妥当性を共同で促進するマルチ制約報酬を設計する。
さらに,本研究は,現実的なトレーニングと評価を支援するために,実行可能なCAD-CAEタスクを備えた25のコンポーネントカテゴリをカバーする,業界対応のデータセットを寄贈する。
実験により、COSMO-Agentトレーニングは制約駆動設計のための小さなオープンソース LLM を大幅に改善し、実現可能性、効率、安定性において大きなオープンソースおよび強力なクローズドソースモデルを上回ることが示されている。
関連論文リスト
- Execution-Verified Reinforcement Learning for Optimization Modeling [49.171122807323634]
実行検証学習フレームワークは、数学的プログラミング解法を決定論的で対話的な検証器として扱う。
NL4OPT, MAMO, IndustryOR, OptiBenchをグロビ, OR-Tools, COPTで行った実験では, EVOMがプロセス管理SFTに適合または優れていた。
論文 参考訳(メタデータ) (2026-04-01T03:39:11Z) - CME-CAD: Heterogeneous Collaborative Multi-Expert Reinforcement Learning for CAD Code Generation [30.08737988265254]
スケッチから3Dモデルを再構築する既存の方法は、しばしば非編集可能で近似的なモデルを生成する。
本稿では,CADコード生成のための新しい訓練パラダイムであるCME-CAD(Heterogeneous Collaborative Multi-Expert Reinforcement Learning)パラダイムを提案する。
MERL(Multi-Expert Fine-Tuning)とMulti-Expert Reinforcement Learning(MERL)という2段階の学習プロセスを導入する。
論文 参考訳(メタデータ) (2025-12-29T09:37:53Z) - Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。
ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。
我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文 参考訳(メタデータ) (2025-10-11T18:11:09Z) - From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.67703214044401]
CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-08-13T18:30:49Z) - Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments [70.42705564227548]
大規模言語モデル(LLM)のための環境自動構築パイプラインを提案する。
これにより、外部ツールに頼ることなく、詳細な測定可能なフィードバックを提供する高品質なトレーニング環境の作成が可能になる。
また、ツール使用の精度とタスク実行の完全性の両方を評価する検証可能な報酬機構も導入する。
論文 参考訳(メタデータ) (2025-08-12T09:45:19Z) - Generative AI for CAD Automation: Leveraging Large Language Models for 3D Modelling [31.94035963354055]
大規模言語モデル(LLM)は、効率性、スケーラビリティ、革新性を向上させることで産業に革命をもたらしている。
本稿では,フリーCAD と LLM をCAD ツールとして統合することにより,CAD の自動設計における LLM の可能性を検討する。
本稿では,LLMが自然言語記述からCADスクリプトを生成するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-05T23:30:17Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - BlenderLLM: Training Large Language Models for Computer-Aided Design with Self-improvement [45.19076032719869]
我々は,大規模言語モデル(LLM)をCAD(Computer-Aided Design)で訓練するフレームワークであるBlenderLLMを提案する。
以上の結果から,既存のモデルではCADスクリプトの正確な生成に重大な制限があることが明らかとなった。
命令ベースの微調整と反復的な自己改善によって、BlenderLLMはCADスクリプト生成の機能と精度の両方においてこれらのモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2024-12-16T14:34:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。