論文の概要: Swarm Intelligence Enhanced Reasoning: A Density-Driven Framework for LLM-Based Multi-Agent Optimization
- arxiv url: http://arxiv.org/abs/2505.17115v2
- Date: Fri, 30 May 2025 08:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 15:03:35.149978
- Title: Swarm Intelligence Enhanced Reasoning: A Density-Driven Framework for LLM-Based Multi-Agent Optimization
- Title(参考訳): Swarm Intelligence Enhanced Reasoning: LLMベースのマルチエージェント最適化のための密度駆動フレームワーク
- Authors: Ying Zhu, Heng Zhou, Rui Su, Peiqin Zhuang, Lei Bai,
- Abstract要約: 本稿では,新しいエージェントベースのSwarm Intelligence(ASI)パラダイムを導入することにより,Swarmインテリジェンスを推論プロセスに統合することを提案する。
そこで我々は,Swarm Intelligence Enhancing Reasoningフレームワークを開発した。
- 参考スコア(独自算出の注目度): 18.912255448200888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, many approaches, such as Chain-of-Thought (CoT) prompting and Multi-Agent Debate (MAD), have been proposed to further enrich Large Language Models' (LLMs) complex problem-solving capacities in reasoning scenarios. However, these methods may fail to solve complex problems due to the lack of ability to find optimal solutions. Swarm Intelligence has been serving as a powerful tool for finding optima in the field of traditional optimization problems. To this end, we propose integrating swarm intelligence into the reasoning process by introducing a novel Agent-based Swarm Intelligence (ASI) paradigm. In this paradigm, we formulate LLM reasoning as an optimization problem and use a swarm intelligence scheme to guide a group of LLM-based agents in collaboratively searching for optimal solutions. To avoid swarm intelligence getting trapped in local optima, we further develop a Swarm Intelligence Enhancing Reasoning (SIER) framework, which develops a density-driven strategy to enhance the reasoning ability. To be specific, we propose to perform kernel density estimation and non-dominated sorting to optimize both solution quality and diversity simultaneously. In this case, SIER efficiently enhances solution space exploration through expanding the diversity of the reasoning path. Besides, a step-level quality evaluation is used to help agents improve solution quality by correcting low-quality intermediate steps. Then, we use quality thresholds to dynamically control the termination of exploration and the selection of candidate steps, enabling a more flexible and efficient reasoning process. Extensive experiments are ...
- Abstract(参考訳): 近年,CAT(Chain-of-Thought)プロンプトやマルチエージェント・ディベート(Multi-Agent Debate,MAD)といった多くの手法が提案され,推論シナリオにおける大規模言語モデル(LLM)の複雑な問題解決能力の強化が提案されている。
しかし、これらの手法は最適解を見つける能力の欠如により複雑な問題を解くことができない可能性がある。
Swarm Intelligenceは、従来の最適化問題の分野で最適なものを見つけるための強力なツールとして機能している。
そこで本研究では,新しいエージェントベースのSwarm Intelligence(ASI)パラダイムを導入することにより,Swarmインテリジェンスを推論プロセスに統合することを提案する。
このパラダイムでは、最適化問題としてLLM推論を定式化し、Swarmインテリジェンススキームを用いて、LLMをベースとしたエージェント群を協調して最適解を探索する。
局所最適状態に閉じ込められるのを避けるため、我々はさらにSwarm Intelligence Enhancing Reasoning(SIER)フレームワークを開発し、推論能力を高めるために密度駆動型戦略を開発する。
具体的には、カーネル密度推定と非支配的ソートを行い、ソリューションの品質と多様性を同時に最適化することを提案する。
この場合、SIERは推論経路の多様性を拡大し、解空間探索を効率的に行う。
さらに、低品質中間段階を修正することで、エージェントのソリューション品質向上を支援するために、ステップレベルの品質評価が使用される。
次に,探索の終了と候補段階の選択を動的に制御するために品質閾値を用い,より柔軟で効率的な推論プロセスを実現する。
大規模な実験は...
関連論文リスト
- Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization [80.09112808413133]
Mujicaは、質問をサブクエストの非循環グラフに分解するプランナーであり、検索と推論を通じて質問を解決するワーカーである。
MyGOは、従来のポリシー更新を勾配的いいねりの最大推定に置き換える、新しい強化学習手法である。
複数のデータセットにまたがる実験結果から,マルチホップQA性能向上における MujicaMyGO の有効性が示された。
論文 参考訳(メタデータ) (2025-05-20T18:33:03Z) - Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:47:00Z) - Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.25394449773052]
大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。
通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。
本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文 参考訳(メタデータ) (2024-10-10T17:00:06Z) - Large Language Model-Aided Evolutionary Search for Constrained Multiobjective Optimization [15.476478159958416]
我々は,制約付き多目的最適化問題に対する進化探索を強化するために,大規模言語モデル(LLM)を用いる。
私たちの目標は、進化の集団の収束を早めることです。
論文 参考訳(メタデータ) (2024-05-09T13:44:04Z) - SEGO: Sequential Subgoal Optimization for Mathematical Problem-Solving [64.38649623473626]
大規模言語モデル(LLM)は人工知能の大幅な進歩を導いた。
数学的問題を解く能力を高めるために,textbfSEquential subtextbfGoal textbfOptimization (SEGO) という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T17:56:40Z) - Federated Multi-Level Optimization over Decentralized Networks [55.776919718214224]
エージェントが隣人としか通信できないネットワーク上での分散マルチレベル最適化の問題について検討する。
ネットワーク化されたエージェントが1つの時間スケールで異なるレベルの最適化問題を解くことができる新しいゴシップに基づく分散マルチレベル最適化アルゴリズムを提案する。
提案アルゴリズムは, ネットワークサイズと線形にスケーリングし, 各種アプリケーション上での最先端性能を示す。
論文 参考訳(メタデータ) (2023-10-10T00:21:10Z) - Multi-surrogate Assisted Efficient Global Optimization for Discrete
Problems [0.9127162004615265]
本稿では、離散的な問題を解くために、複数のシミュレーションベースの代理モデルの同時利用の可能性について検討する。
以上の結果から,SAMA-DiEGOはテスト問題の大部分において,より優れた解に迅速に収束できることが示唆された。
論文 参考訳(メタデータ) (2022-12-13T09:10:08Z) - Simulation-guided Beam Search for Neural Combinatorial Optimization [13.072343634530883]
ニューラル最適化問題に対するシミュレーション誘導ビームサーチ(SGBS)を提案する。
我々は、SGBSと効率的なアクティブサーチ(EAS)を併用し、SGBSはEASでバックプロパゲーションされたソリューションの品質を高める。
提案手法をよく知られたCOベンチマークで評価し,SGBSが合理的な仮定で得られた解の質を著しく向上することを示す。
論文 参考訳(メタデータ) (2022-07-13T13:34:35Z) - Multi-Agent Deep Reinforcement Learning in Vehicular OCC [14.685237010856953]
我々は車載OCCにおけるスペクトル効率最適化手法を提案する。
我々は最適化問題をマルコフ決定プロセス(MDP)としてモデル化し、オンラインで適用可能なソリューションの利用を可能にする。
提案手法の性能を広範囲なシミュレーションにより検証し,提案手法の様々な変種とランダムな手法との比較を行った。
論文 参考訳(メタデータ) (2022-05-05T14:25:54Z) - Multi-Level Evolution Strategies for High-Resolution Black-Box Control [0.2320417845168326]
本稿では進化戦略(ES)にマルチレベル(m-lev)機構を導入する。
これは、決定変数の詳細な離散化の恩恵を受けることができる、グローバルな最適化問題のクラスに対処する。
論文 参考訳(メタデータ) (2020-10-04T09:24:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。