論文の概要: Understanding Conversational Patterns in Multi-agent Programming: A Case Study on Fibonacci Game Development
- arxiv url: http://arxiv.org/abs/2605.24138v1
- Date: Fri, 22 May 2026 18:56:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.646304
- Title: Understanding Conversational Patterns in Multi-agent Programming: A Case Study on Fibonacci Game Development
- Title(参考訳): マルチエージェントプログラミングにおける会話パターンの理解:Fibonacciゲーム開発を事例として
- Authors: Srijita Basu, Viktor Kjellberg, Simin Sun, Bengt Haraldsson, Md. Abu Ahammed Babu, Wilhelm Meding, Farnaz Fotrousi, Miroslaw Staron,
- Abstract要約: 大規模言語モデル(LLM)は、ソフトウェア工学(SE)にますます適用されつつあるが、自律的で役割指向のコラボレーションのポテンシャルは、いまだほとんど調査されていない。
最近の実証研究は、非構造的あるいは理解されていない相互作用のダイナミクスが、誤りの伝播、不正確な解に関する早めのコンセンサス、あるいは収束を妨げる長い不一致をもたらすことを示している。
系統的なアプローチでは,効率(収束の速度と安定性),一貫性(BLEUとROUGEが視覚化した役割アライメントの程度),有効性(コンパイル成功度とエラー解決度)という,マルチエージェントインタラクションの3つの重要な側面を明らかにしている。
- 参考スコア(独自算出の注目度): 3.4626911764686032
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are increasingly applied to software engineering (SE), yet their potential for autonomous, role-oriented collaboration remains largely underexplored. Understanding how multiple LLM-based agents coordinate, maintain role alignment, and converge on solutions is critical for SE, as naively allowing agents to interact does not reliably lead to correct or stable outcomes. Recent empirical studies show that unstructured or poorly understood interaction dynamics can result in error propagation, premature consensus on incorrect solutions, or prolonged disagreement that prevents convergence, even when correct partial solutions are present early in the interaction. As an initial step towards addressing this underexplored area, we undertake a systematic analysis of conversations between two agents, a Designer and a Programmer across 12 model combinations from 7 open-source LLMs (Gemma 2, Gemma 3, LLaMA 3.2, LLaMA 3.3, DeepSeek-R1, MiniCPM, and Qwen3). Our systematic approach reveals three key dimensions of multi-agent interaction: efficiency (the speed and stability of convergence), consistency (the degree of role alignment visualized by BLEU and ROUGE), and effectiveness (the extent of compilation success and error resolution). Results show that the DeepSeek-R1:DeepSeek-R1 pair was unique in converging to the correct solution from the very first iteration and sustaining it consistently to the final iteration, while LLaMA 3.2:LLaMA 3.2 and Qwen3:Qwen3 demonstrated strong Designer:Programmer role alignment despite of diverging from the correct solution. The other pairs deviated from the task, never to converge to a result. These findings advance understanding of agentic programming and highlight the need for further research on understanding and calibrating convergence and stop conditions essential for future autonomous SE.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ソフトウェア工学(SE)にますます適用されつつあるが、自律的で役割指向のコラボレーションの可能性は、大半が未熟である。
複数のLSMベースのエージェントがどのように協調し、役割アライメントを維持し、ソリューションに収束するかを理解することは、SEにとって重要である。
近年の実証研究では、非構造的あるいは理解されていない相互作用のダイナミクスが、誤りの伝播、不正解に対する早期のコンセンサス、あるいは、相互作用の初期段階に正しい部分解が存在する場合でも収束を阻害する長い不一致をもたらすことが示されている。
この未調査領域に対処するための最初のステップとして,7つのオープンソース LLM (Gemma 2, Gemma 3, LLaMA 3.2, LLaMA 3.3, DeepSeek-R1, MiniCPM, Qwen3) から12のモデルの組み合わせを対象とした,Designer と Programmer という2つのエージェント間の対話を体系的に解析する。
系統的なアプローチでは,効率(収束の速度と安定性),一貫性(BLEUとROUGEが視覚化した役割アライメントの程度),有効性(コンパイル成功度とエラー解決度)という,マルチエージェントインタラクションの3つの重要な側面を明らかにしている。
その結果、DeepSeek-R1:DeepSeek-R1のペアは、最初のイテレーションから正しいソリューションに収束し、最終イテレーションまで一貫して継続するという点でユニークであり、LLaMA 3.2:LLaMA 3.2とQwen3:Qwen3は、正しいソリューションから分岐したにもかかわらず強力なDesigner:Programmerロールアライメントを示した。
他のペアはタスクから逸脱し、結果に収束することはありません。
これらの知見はエージェントプログラミングの理解を前進させ、将来の自律型SEに必要な収束と停止条件の理解と校正に関するさらなる研究の必要性を強調している。
関連論文リスト
- Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems [65.90791804095561]
マルチエージェントシステムは、特殊エージェント間の構造化された協調を通じてこの問題に対処するが、より厳密な調整は、あまり検討されていないリスクを増幅する。
既存の調査では、個々のエージェント能力、マルチエージェントのコラボレーション、エージェントの自己進化を別々にカバーしている。
この調査は4つの因果関係のあるステージを中心にまとめられた統一されたレビューを提供する。これはLIFEの進展(Lay the capabilities foundation)、協力によるエージェントの統合、帰属による障害の発見、自律的な自己改善によるEvolveである。
論文 参考訳(メタデータ) (2026-05-14T14:36:13Z) - TacoMAS: Test-Time Co-Evolution of Topology and Capability in LLM-based Multi-Agent Systems [55.81570336226014]
動的マルチエージェントシステムのためのテスト時間共進化フレームワークであるTacoMASを紹介する。
TacoMASはMAS推論をオンライングラフ適応のタスクとして定式化し、ノードは役割固有の能力を持つエージェントを表し、エッジはその通信トポロジを定義する。
4つのベンチマークの実験では、TacoMASは20近いマルチエージェントベースラインを上回り、最強ベースラインよりも平均13.3%向上した。
論文 参考訳(メタデータ) (2026-05-10T13:52:00Z) - AsymPuzl: An Asymmetric Puzzle for multi-agent cooperation [3.992018836888768]
大規模言語モデル(LLM)エージェントは、マルチターン、マルチエージェントのシナリオでますます研究されている。
AsymPuzlは,情報非対称性下でのコミュニケーションを分離するように設計された,最小かつ表現力に富んだ2エージェントパズル環境である。
論文 参考訳(メタデータ) (2025-12-03T05:42:01Z) - Benefits and Limitations of Communication in Multi-Agent Reasoning [11.788489289062312]
マルチエージェントシステムの表現性を解析するための理論的枠組みを提案する。
i) タスクを正確に解くために必要なエージェントの数, (ii) エージェント間通信の量と構造, (iii) 達成可能なスピードアップを問題サイズとコンテキストスケールとして導出する。
本研究は,コミュニケーションが有益である状況を特定し,エージェント数と帯域幅のトレードオフを明確化し,いずれのリソースにも制約がある場合の本質的な制約を明らかにする。
論文 参考訳(メタデータ) (2025-10-14T20:04:27Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Why Do Multi-Agent LLM Systems Fail? [87.90075668488434]
MAST-Dataは7つの人気のあるMASフレームワークで収集された1600以上の注釈付きトレースの包括的なデータセットである。
我々はMAST(Multi-Agent System Failure Taxonomy)を初めて構築する。
MASTとMAST-Dataを利用して、モデル(GPT4、Claude 3、Qwen2.5、CodeLlama)とタスク(コーディング、数学、汎用エージェント)の障害パターンを分析します。
論文 参考訳(メタデータ) (2025-03-17T19:04:38Z) - When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文 参考訳(メタデータ) (2025-02-21T02:24:43Z) - Causal Mean Field Multi-Agent Reinforcement Learning [10.767740092703777]
平均場強化学習(MFRL)と呼ばれるフレームワークは、平均場理論を用いることでスケーラビリティの問題を軽減することができる。
このフレームワークには、非定常環境下での本質的な相互作用を識別する能力がない。
拡張性問題に対処するために,因果平均Q-ラーニング (CMFQ) と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-20T02:15:58Z) - Collaboration Dynamics and Reliability Challenges of Multi-Agent LLM Systems in Finite Element Analysis [3.437656066916039]
インターエイジェントダイナミクスが推論の品質と信頼性にどのように影響するかは、まだ不明である。
線形弾性有限要素解析(FEA)のためのAutoGenベースのマルチエージェントフレームワークを用いたこれらのメカニズムについて検討する。
1,120のコントロールされたトライアルから、コラボレーションの有効性は、チームのサイズよりも機能的な相補性に依存することが分かりました。
論文 参考訳(メタデータ) (2024-08-23T23:11:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。