Fugu-MT 論文翻訳(概要): Multi-Agent Large Language Models for Conversational Task-Solving

論文の概要: Multi-Agent Large Language Models for Conversational Task-Solving

arxiv url: http://arxiv.org/abs/2410.22932v2
Date: Fri, 01 Nov 2024 12:37:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:42.301675
Title: Multi-Agent Large Language Models for Conversational Task-Solving
Title（参考訳）: 対話型タスクソルビングのための多言語大言語モデル
Authors: Jonas Becker,
Abstract要約: 対話型タスク解決における新たな主人公として,マルチエージェントシステムが誕生する。複雑さの異なるタスク間で、マルチエージェントの議論がどのように機能するかは、いまだ不明である。 2022年から2024年までの20のマルチエージェント研究の分類について提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In an era where single large language models have dominated the landscape of artificial intelligence for years, multi-agent systems arise as new protagonists in conversational task-solving. While previous studies have showcased their potential in reasoning tasks and creative endeavors, an analysis of their limitations concerning the conversational paradigms and the impact of individual agents is missing. It remains unascertained how multi-agent discussions perform across tasks of varying complexity and how the structure of these conversations influences the process. To fill that gap, this work systematically evaluates multi-agent systems across various discussion paradigms, assessing their strengths and weaknesses in both generative tasks and question-answering tasks. Alongside the experiments, I propose a taxonomy of 20 multi-agent research studies from 2022 to 2024, followed by the introduction of a framework for deploying multi-agent LLMs in conversational task-solving. I demonstrate that while multi-agent systems excel in complex reasoning tasks, outperforming a single model by leveraging expert personas, they fail on basic tasks. Concretely, I identify three challenges that arise: 1) While longer discussions enhance reasoning, agents fail to maintain conformity to strict task requirements, which leads to problem drift, making shorter conversations more effective for basic tasks. 2) Prolonged discussions risk alignment collapse, raising new safety concerns for these systems. 3) I showcase discussion monopolization through long generations, posing the problem of fairness in decision-making for tasks like summarization. This work uncovers both the potential and challenges that arise with multi-agent interaction and varying conversational paradigms, providing insights into how future research could improve the efficiency, performance, and safety of multi-agent LLMs.
Abstract（参考訳）: 1つの大きな言語モデルが人工知能のランドスケープを支配してきた時代には、対話型タスク解決における新しい主人公としてマルチエージェントシステムが出現する。これまでの研究では、推論タスクや創造的な取り組みにおけるその可能性を示してきたが、会話のパラダイムや個々のエージェントの影響に関する制限が欠落している。複雑さの異なるタスク間でマルチエージェントの議論がどのように機能するか、これらの会話の構造がプロセスにどのように影響するかは、まだ不明である。このギャップを埋めるために、この研究は様々な議論パラダイムにまたがるマルチエージェントシステムを体系的に評価し、生成タスクと質問応答タスクの両方の長所と短所を評価する。実験とともに,2022年から2024年までの20種類のマルチエージェント研究の分類法を提案するとともに,対話型タスク解決におけるマルチエージェントLSMの展開のための枠組みを導入する。マルチエージェントシステムは複雑な推論タスクに優れ、専門家のペルソナを活用して1つのモデルよりも優れていますが、基本的なタスクでは失敗します。具体的には、私は3つの課題を特定します。 1) より長い議論により推論が促進されるが, エージェントは厳密なタスク要求に適合せず, 課題の漂流を招き, 基本的なタスクに対してより効果的な会話を行う。 2 リスクアライメントが崩壊し、これらのシステムに対する新たな安全上の懸念が高まること。 3) 要約等の課題における意思決定の公平性の問題として, 長期にわたる議論の独占化を論じる。この研究は、マルチエージェントインタラクションと様々な会話パラダイムによって生じる可能性と課題の両方を明らかにし、将来の研究がマルチエージェントLLMの効率、性能、安全性をどのように改善するかについての洞察を提供する。

関連論文リスト

UniConv: Unifying Retrieval and Response Generation for Large Language Models in Conversations [71.79210031338464]
会話における大規模言語モデルに対する高密度検索と応答生成の統一方法を示す。目的の異なる共同微調整を行い、不整合リスクを低減するための2つのメカニズムを設計する。 5つの対話型検索データセットの評価は、我々の統合モデルがタスクを相互に改善し、既存のベースラインより優れていることを示す。
論文参考訳（メタデータ） (2025-07-09T17:02:40Z)
A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions [51.96890647837277]
大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
論文参考訳（メタデータ） (2025-04-07T21:01:25Z)
Is Multi-Agent Debate (MAD) the Silver Bullet? An Empirical Analysis of MAD in Code Summarization and Translation [10.038721196640864]
マルチエージェント・ディベート (MAD) システムは,大規模言語モデル (LLM) 間の構造化された議論を可能にする MADは、役割特異的なエージェント、動的相互作用、構造化された意思決定を通じて、散発的な思考を促進する。本研究では,2つのソフトウェア工学(SE)タスクにおけるMADの有効性について検討する。
論文参考訳（メタデータ） (2025-03-15T07:30:37Z)
A Survey on Complex Tasks for Goal-Directed Interactive Agents [60.53915548970061]
この調査は、目標指向の対話エージェントを評価するための、関連するタスクと環境をコンパイルする。関連リソースの最新のコンパイルは、プロジェクトのWebサイトにある。
論文参考訳（メタデータ） (2024-09-27T08:17:53Z)
Adaptive In-conversation Team Building for Language Model Agents [33.03550687362213]
複数の大規模言語モデル(LLM)エージェントを活用することは、複雑なタスクに取り組む上で有望なアプローチであることが示されている。私たちの新しい適応型チーム構築パラダイムは、Captain Agentという新しいエージェント設計を通じて実現された柔軟なソリューションを提供します。 6つの実世界のシナリオに対する包括的な評価は、Captain Agentが既存のマルチエージェントメソッドを大幅に上回っていることを示している。
論文参考訳（メタデータ） (2024-05-29T18:08:37Z)
CoMM: Collaborative Multi-Agent, Multi-Reasoning-Path Prompting for Complex Problem Solving [9.446546965008249]
協調型マルチエージェント・マルチレゾニングパス(CoMM)プロンプトフレームワークを提案する。具体的には、LLMが問題解決チームで異なる役割を演じるように促し、異なるロールプレイエージェントが目的のタスクを協調的に解決するように促します。 2つの大学レベルの科学問題に対する提案手法の有効性を実証した。
論文参考訳（メタデータ） (2024-04-26T23:29:12Z)
Large Multimodal Agents: A Survey [78.81459893884737]
大規模言語モデル(LLM)は、テキストベースのAIエージェントのパワーで優れたパフォーマンスを実現している。 LLMを利用したAIエージェントをマルチモーダルドメインに拡張することに焦点を当てた、新たな研究トレンドがある。本総説は, この急速に発展する分野において, 今後の研究に有用な洞察とガイドラインを提供することを目的としている。
論文参考訳（メタデータ） (2024-02-23T06:04:23Z)
MacGyver: Are Large Language Models Creative Problem Solvers? [87.70522322728581]
本稿では, 現代LLMの創造的問題解決能力について, 制約付き環境下で検討する。我々は1,600以上の実世界の問題からなる自動生成データセットであるMACGYVERを作成する。我々はLLMと人間の両方にコレクションを提示し、それらの問題解決能力を比較して比較する。
論文参考訳（メタデータ） (2023-11-16T08:52:27Z)
On the Discussion of Large Language Models: Symmetry of Agents and Interplay with Prompts [51.3324922038486]
本稿では,プロンプトの相互作用と議論機構の実証結果について報告する。また、コンピュートとマージに基づくスケーラブルな議論機構も提案している。
論文参考訳（メタデータ） (2023-11-13T04:56:48Z)
Multitask Multimodal Prompted Training for Interactive Embodied Task Completion [48.69347134411864]
Embodied MultiModal Agent (EMMA) はエンコーダとデコーダの統一モデルである。すべてのタスクをテキスト生成として統一することで、EMMAはタスク間の転送を容易にするアクション言語を学ぶ。
論文参考訳（メタデータ） (2023-11-07T15:27:52Z)
Responsible Emergent Multi-Agent Behavior [2.9370710299422607]
Responsible AIの最先端技術は、人間の問題はマルチエージェントの問題である、という重要なポイントを無視した。交通の運転から経済政策の交渉まで、人間の問題解決には複数の個人の行動と動機の相互作用と相互作用が伴う。この論文は、責任ある創発的マルチエージェント行動の研究を発展させる。
論文参考訳（メタデータ） (2023-11-02T21:37:32Z)
Multi-Agent Consensus Seeking via Large Language Models [6.922356864800498]
大規模言語モデル(LLM)によって駆動されるマルチエージェントシステムは、複雑なタスクを協調的に解決する有望な能力を示している。この研究は、マルチエージェントコラボレーションにおける根本的な問題であるコンセンサス探索について考察する。
論文参考訳（メタデータ） (2023-10-31T03:37:11Z)
Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文参考訳（メタデータ） (2023-09-29T13:33:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。