論文の概要: Can LLM Agents Sustain Long-Horizon Organizational Dynamics?
- arxiv url: http://arxiv.org/abs/2606.01199v1
- Date: Sun, 31 May 2026 12:28:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.376604
- Title: Can LLM Agents Sustain Long-Horizon Organizational Dynamics?
- Title(参考訳): LLM剤は長期組織動態を持続できるか?
- Authors: Xuancheng Zhu, Yang Yue, Shuaibing Wan, Zihan Dou, Xiaohan Zhang, Yongrui Liu, Guoshun Nan,
- Abstract要約: TaskWeaveは階層的なエージェント型フレームワークで、F-D-D-Alignサイクルを通じて計画状態を維持し、依存性を意識したトレースメモリを通じて実行を基盤とする。
実験によると、TaskWeaveは、接地されたアーティファクトを生成し、外部環境に適応しながら、コヒーレントで長期にわたる組織力学をサポートする。
- 参考スコア(独自算出の注目度): 12.155708971378216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language agents are increasingly used for social simulation, yet it remains unclear whether they can sustain coherent behavior in structured organizations, where goals must propagate through hierarchy, tasks depend on prior execution, and artifacts accumulate over long horizons. We formulate long-horizon organizational simulation as a memory-centered coordination problem and introduce TaskWeave, a hierarchical agentic framework that maintains planning states through a Formulate-Partition-Diagnose-Align cycle and grounds execution through dependency-aware trace memory. We evaluate TaskWeave in a year-long IT company simulation and compare it with other multi-agent frameworks on organizational coherence, execution grounding, and downstream enterprise NLP utility. Experiments show that TaskWeave supports coherent and long-horizon organizational dynamics while producing grounded artifacts and adapting to external environments. These findings suggest that structured simulation memory is a key mechanism for building reliable LLM-based organizational simulators.
- Abstract(参考訳): 大規模言語エージェントはますます社会シミュレーションに使われているが、構造組織においてコヒーレントな行動を維持することができるかどうかは不明だ。
本研究では,長期の組織シミュレーションをメモリ中心の協調問題として定式化し,F-D-D-Alignサイクルを通した計画状態の維持と,依存性を意識したトレースメモリによる実行を基盤とする階層型エージェントフレームワークであるTaskWeaveを導入する。
私たちは1年間のIT企業シミュレーションでTaskWeaveを評価し、組織的一貫性、実行基盤、下流のエンタープライズNLPユーティリティに関する他のマルチエージェントフレームワークと比較します。
実験によると、TaskWeaveは、接地されたアーティファクトを生成し、外部環境に適応しながら、コヒーレントで長期にわたる組織力学をサポートする。
これらの結果は,構造化シミュレーションメモリが信頼性の高いLCM組織シミュレータ構築の鍵となるメカニズムであることを示唆している。
関連論文リスト
- AutoB2G: A Large Language Model-Driven Agentic Framework For Automated Building-Grid Co-Simulation [6.259798608712568]
AutoB2Gは、自然言語によるタスク記述に基づく、ビルディンググリッドの自動シミュレーションフレームワークである。
これにより、B2Gインタラクションをコーディネートすることで、グリッド側のパフォーマンス指標を改善することができる。
論文 参考訳(メタデータ) (2026-03-27T01:44:08Z) - Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.01709143437043]
階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。
具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。
我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2025-11-21T12:25:47Z) - TALM: Dynamic Tree-Structured Multi-Agent Framework with Long-Term Memory for Scalable Code Generation [0.0]
エージェントコード生成には、複雑なコンテキスト管理と多段階推論が可能な大きな言語モデルが必要である。
本稿では,構造化タスク分解,局所化再推論,長期記憶機構を統合した動的フレームワークTALMを提案する。
HumanEval、BigCodeBench、ClassEvalベンチマークの実験結果は、TALMが一貫して強力な推論性能と高いトークン効率を提供することを示している。
論文 参考訳(メタデータ) (2025-10-27T05:07:36Z) - State and Memory is All You Need for Robust and Reliable AI Agents [29.259008600842517]
大規模言語モデル(LLM)は、自然言語の理解と生成において強力な進歩を実現している。
しかし、複雑な現実世界の科学への応用は、記憶、計画、ツール統合の課題によって制限されている。
本稿では、LLMベースのエージェントが自律的に計画し、推論し、堅牢で信頼性の高いドメイン固有タスク実行を実現することができるモジュール型エージェントフレームワークであるSciBORGを紹介する。
論文 参考訳(メタデータ) (2025-06-30T02:02:35Z) - Multi-Agent Collaboration via Evolving Orchestration [55.574417128944226]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models [38.89166693142495]
ET-Plan-Benchは、Large Language Models (LLMs) を用いたタスク計画の具体化のためのベンチマークである。
様々な難易度や複雑さのレベルにおいて、制御可能で多様な実施タスクが特徴である。
我々のベンチマークでは、大規模で定量化され、高度に自動化され、きめ細かな診断フレームワークとして認識されている。
論文 参考訳(メタデータ) (2024-10-02T19:56:38Z) - Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More? [54.667202878390526]
長文言語モデル(LCLM)は、従来、検索システムやデータベースといった外部ツールに依存していたタスクへのアプローチに革命をもたらす可能性がある。
実世界のタスクのベンチマークであるLOFTを導入し、文脈内検索と推論においてLCLMの性能を評価するために設計された数百万のトークンを出力する。
以上の結果からLCLMは,これらのタスクを明示的に訓練したことがないにも関わらず,最先端の検索システムやRAGシステムと競合する驚くべき能力を示した。
論文 参考訳(メタデータ) (2024-06-19T00:28:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。