論文の概要: SwarmSys: Decentralized Swarm-Inspired Agents for Scalable and Adaptive Reasoning
- arxiv url: http://arxiv.org/abs/2510.10047v1
- Date: Sat, 11 Oct 2025 06:28:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.748975
- Title: SwarmSys: Decentralized Swarm-Inspired Agents for Scalable and Adaptive Reasoning
- Title(参考訳): SwarmSys: スケーラブルで適応型推論のための分散Swarmインスパイアエージェント
- Authors: Ruohao Li, Hongjun Liu, Leyi Zhao, Zisu Li, Jiawei Li, Jiajun Jiang, Linning Xu, Chen Zhao, Mingming Fan, Chen Liang,
- Abstract要約: SwarmSysは,Swarmインテリジェンスにインスパイアされた分散マルチエージェント推論のためのクローズドループフレームワークである。
我々は,SwarmSysが記号的推論,研究合成,科学プログラミングのタスクにおいて,ベースラインを一貫して上回っていることを示す。
これらの知見は、スケーラブルで堅牢で適応的なマルチエージェント推論のための、有望なパラダイムとして、Swarmにインスパイアされたコーディネーションを強調している。
- 参考スコア(独自算出の注目度): 35.8373734207328
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) agents have shown remarkable reasoning abilities. However, existing multi-agent frameworks often rely on fixed roles or centralized control, limiting scalability and adaptability in long-horizon reasoning. We introduce SwarmSys, a closed-loop framework for distributed multi-agent reasoning inspired by swarm intelligence. Coordination in SwarmSys emerges through iterative interactions among three specialized roles, Explorers, Workers, and Validators, that continuously cycle through exploration, exploitation, and validation. To enable scalable and adaptive collaboration, we integrate adaptive agent and event profiles, embedding-based probabilistic matching, and a pheromone-inspired reinforcement mechanism, supporting dynamic task allocation and self-organizing convergence without global supervision. Across symbolic reasoning, research synthesis, and scientific programming tasks, SwarmSys consistently outperforms baselines, improving both accuracy and reasoning stability. These findings highlight swarm-inspired coordination as a promising paradigm for scalable, robust, and adaptive multi-agent reasoning, suggesting that coordination scaling may rival model scaling in advancing LLM intelligence.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは、顕著な推論能力を示している。
しかし、既存のマルチエージェントフレームワークは、しばしば固定された役割や集中的な制御に依存し、長期の推論においてスケーラビリティと適応性を制限する。
SwarmSysは,Swarmインテリジェンスにインスパイアされた分散マルチエージェント推論のためのクローズドループフレームワークである。
SwarmSysのコーディネーションは、エクスプローラー、ワーカー、バリケータの3つの特別な役割間の反復的な相互作用を通じて現れ、探索、エクスプロイト、検証を通じて継続的に循環する。
そこで我々は,適応エージェントとイベントプロファイル,組込み型確率マッチング,フェロモンにインスパイアされた強化機構を統合し,動的タスク割り当てと自己組織的収束をグローバルな監督なしに支援する。
記号的推論、研究合成、科学的なプログラミングタスク全体にわたって、SwarmSysはベースラインを一貫して上回り、精度と推論安定性の両方を改善している。
これらの結果は、スケーラブルで堅牢で適応的なマルチエージェント推論のための有望なパラダイムとして、Swarmにインスパイアされたコーディネーションが注目され、コーディネーションスケーリングはLLMインテリジェンスの進歩においてモデルスケーリングに匹敵する可能性があることを示唆している。
関連論文リスト
- Guided Collaboration in Heterogeneous LLM-Based Multi-Agent Systems via Entropy-Based Understanding Assessment and Experience Retrieval [35.96356869281219]
本稿では,強弱系における反直観的現象について述べる。
本稿では,各エージェントの認知状態を動的に調整するエントロピーに基づく適応誘導フレームワークを提案する。
我々のアプローチは、不均一なコラボレーションの有効性と安定性を一貫して向上させる。
論文 参考訳(メタデータ) (2026-02-14T07:10:04Z) - Towards Adaptive, Scalable, and Robust Coordination of LLM Agents: A Dynamic Ad-Hoc Networking Perspective [31.81236449944822]
RAPSは、LLMエージェントの適応性、拡張性、堅牢な調整のための、評判の高いパブリッシュ・サブスクライブ・パラダイムである。
RAPSは2つの一貫性のあるオーバーレイを組み込んでいる: (i) リアクティブ・サブスクライブ(reactive Subscription) エージェントがその意図を動的に洗練することを可能にし、 (ii) ベイジアン・レピュテーション(Bayesian Reputation)。
論文 参考訳(メタデータ) (2026-02-08T15:26:02Z) - Agentic Reasoning for Large Language Models [122.81018455095999]
推論は推論、問題解決、意思決定の基礎となる基本的な認知プロセスである。
大規模言語モデル(LLM)は、クローズドワールド設定では強力な推論能力を示すが、オープンエンドおよび動的環境では苦労する。
エージェント推論は、連続的な相互作用を計画し、行動し、学習する自律的なエージェントとしてLLMを解釈することでパラダイムシフトを示す。
論文 参考訳(メタデータ) (2026-01-18T18:58:23Z) - Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。
問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。
BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文 参考訳(メタデータ) (2025-12-20T12:06:13Z) - Diffusion Forcing for Multi-Agent Interaction Sequence Modeling [52.769202433667125]
MAGNetはマルチエージェントモーション生成のための統合された自己回帰拡散フレームワークである。
フレキシブルな条件付けとサンプリングを通じて、幅広いインタラクションタスクをサポートする。
緊密に同期された活動と、ゆるやかに構造化された社会的相互作用の両方をキャプチャする。
論文 参考訳(メタデータ) (2025-12-19T18:59:02Z) - Towards Transparent and Incentive-Compatible Collaboration in Decentralized LLM Multi-Agent Systems: A Blockchain-Driven Approach [21.498244821985562]
本稿では、透過的なエージェント登録、検証可能なタスク割り当て、動的評価追跡を可能にするブロックチェーンベースのフレームワークを提案する。
本実装では, GPT-4エージェントをSolidity契約と統合し, 50ラウンドのシミュレーション, 高いタスク成功率, 安定したユーティリティ分布, 創発的エージェントの特殊化を実演する。
論文 参考訳(メタデータ) (2025-09-20T16:00:24Z) - The Landscape of Agentic Reinforcement Learning for LLMs: A Survey [104.31926740841128]
エージェント強化学習(Agentic RL)の出現は、大規模言語モデル(LLM RL)に適用された従来の強化学習からパラダイムシフトを示している。
本研究では, LLM-RLの縮退した単段階マルコフ決定過程(MDPs)と, エージェントRLを定義する部分可観測マルコフ決定過程(POMDPs)とを対比することにより, この概念シフトを定式化する。
論文 参考訳(メタデータ) (2025-09-02T17:46:26Z) - GenAI-based Multi-Agent Reinforcement Learning towards Distributed Agent Intelligence: A Generative-RL Agent Perspective [35.589506360952925]
我々は、AIに基づく強化学習を通じて、リアクティブからプロアクティブなマルチエージェントインテリジェンスへの変革的パラダイムシフトを論じる。
生成的RLエージェントは、即時観測に反応するのではなく、環境の進化をモデル化し、他のエージェントの振る舞いを予測し、協調されたアクションシーケンスを生成し、長期的ダイナミクスの戦略的推論を行うことができる。
論文 参考訳(メタデータ) (2025-07-13T05:02:43Z) - Multi-Agent Collaboration via Evolving Orchestration [61.93162413517026]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMをベースとしたマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し、中央オーケストレータがタスク状態の進化に応じてエージェントを動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - Benchmarking LLMs' Swarm intelligence [50.544186914115045]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - Neural Orchestration for Multi-Agent Systems: A Deep Learning Framework for Optimal Agent Selection in Multi-Domain Task Environments [0.4640835690336653]
マルチドメインタスク環境における最適なエージェント選択のためのニューラルネットワークフレームワークであるMetaOrchを提案する。
ファジィ評価モジュールは、完全性、妥当性、信頼度に沿ってエージェント応答をスコアし、オーケストレータを訓練するためのソフトインスペクタラベルを生成する。
異種剤を用いた模擬環境実験により, 提案手法が86.3%の選択精度を達成できた。
論文 参考訳(メタデータ) (2025-05-03T02:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。