論文の概要: SOCIA-Nabla: Textual Gradient Meets Multi-Agent Orchestration for Automated Simulator Generation
- arxiv url: http://arxiv.org/abs/2510.18551v1
- Date: Tue, 21 Oct 2025 12:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.454869
- Title: SOCIA-Nabla: Textual Gradient Meets Multi-Agent Orchestration for Automated Simulator Generation
- Title(参考訳): SOCIA-Nabla: 自動シミュレータ生成のためのマルチエージェントオーケストレーションを実現するテキストグラディエント
- Authors: Yuncheng Hua, Sion Weatherhead, Mehdi Jafari, Hao Xue, Flora D. Salim,
- Abstract要約: SOCIA-Nablaは、テキストグラフ内のコードに対するシミュレータ構築の最適化を扱うエンドツーエンドのエージェントフレームワークである。
特殊な計算駆動エージェントをグラフノードとして組み込み、ワークフローマネージャが損失駆動ループを実行する:コード合成 ->実行 ->評価 ->コード修復。
- 参考スコア(独自算出の注目度): 16.707429579441435
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we present SOCIA-Nabla, an end-to-end, agentic framework that treats simulator construction asinstance optimization over code within a textual computation graph. Specialized LLM-driven agents are embedded as graph nodes, and a workflow manager executes a loss-driven loop: code synthesis -> execution -> evaluation -> code repair. The optimizer performs Textual-Gradient Descent (TGD), while human-in-the-loop interaction is reserved for task-spec confirmation, minimizing expert effort and keeping the code itself as the trainable object. Across three CPS tasks, i.e., User Modeling, Mask Adoption, and Personal Mobility, SOCIA-Nabla attains state-of-the-art overall accuracy. By unifying multi-agent orchestration with a loss-aligned optimization view, SOCIA-Nabla converts brittle prompt pipelines into reproducible, constraint-aware simulator code generation that scales across domains and simulation granularities. This work is under review, and we will release the code soon.
- Abstract(参考訳): 本稿では,テキスト計算グラフ内のコードに対するシミュレータ構築のアスタランス最適化を扱う,エンドツーエンドのエージェントフレームワークであるSOCIA-Nablaを提案する。
特殊なLCM駆動エージェントはグラフノードとして組み込み、ワークフローマネージャは損失駆動ループを実行する:コード合成 ->実行 ->評価 ->コード修復。
オープティマイザはTextual-Gradient Descent (TGD)を実行し、ヒューマン・イン・ザ・ループのインタラクションはタスク仕様の確認、専門家の努力の最小化、コード自体をトレーニング可能なオブジェクトとして保持する。
3つのCPSタスク、すなわち、ユーザモデリング、マスク採用、パーソナリティモビリティにおいて、SOCIA-Nablaは全体的な精度を達成している。
損失整合最適化ビューでマルチエージェントオーケストレーションを統合することで、SOCIA-Nablaは脆いプロンプトパイプラインを再現可能な制約対応シミュレータコード生成に変換し、ドメインをまたいでスケールし、粒度をシミュレーションする。
この作業はレビュー中であり、まもなくコードをリリースします。
関連論文リスト
- LLMs as Scalable, General-Purpose Simulators For Evolving Digital Agent Training [55.72784274656801]
構造化されたUI状態と遷移を生成するスケーラブルなパラダイムを導入し、大規模にトレーニングトラジェクトリを合成する。
このパラダイムは、多様なUI状態のためのデジタルワールドシミュレータ、コヒーレント探索のためのガイド付きロールアウトプロセス、軌道ラッパーを統合している。
WebArenaとAndroidWorldの実験では、UI-Simulatorは実際のUIでトレーニングされたオープンソースエージェントと競合するか、あるいは超越している。
論文 参考訳(メタデータ) (2025-10-16T17:59:38Z) - SynthCoder: A Synthetical Strategy to Tune LLMs for Code Completion [7.668823606571788]
コード補完は、ソフトウェア工学における大規模言語モデル(LLM)の顕著な応用である。
本稿では,Fill-in-the-Middle(FIM)コード補完タスクにおける最先端技術を実現するために,業界をリードするプラクティスを統合するモデルであるSynthCoderを提案する。
論文 参考訳(メタデータ) (2025-08-21T12:23:49Z) - ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation [96.44354750396019]
ComfyGPTはタスク記述に基づいてComfyUIを生成するように設計された自動最適化マルチエージェントシステムである。
FlowDatasetは、13,571のワークフロー記述ペアを含む大規模なデータセットである。
FlowBenchはワークフロー生成システムを評価するためのベンチマークである。
論文 参考訳(メタデータ) (2025-03-22T06:48:50Z) - GNNs as Predictors of Agentic Workflow Performances [48.34485750450876]
LLM(Large Language Models)によって起動されるエージェントは、複雑なタスクの処理において顕著な成功を収めた。
本稿では、エージェントを計算グラフとして定式化し、エージェント性能の効率的な予測因子としてグラフニューラルネットワーク(GNN)を提唱する。
エージェントワークフローのパフォーマンスを予測するため,GNNをベンチマークする統合プラットフォームであるFLORA-Benchを構築した。
論文 参考訳(メタデータ) (2025-03-14T11:11:00Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。