論文の概要: CollabSim: A CSCW-Grounded Methodology for Investigating Collaborative Competence of LLM Agents through Controlled Multi-Agent Experiments
- arxiv url: http://arxiv.org/abs/2606.06399v2
- Date: Sat, 06 Jun 2026 00:36:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 12:24:31.356113
- Title: CollabSim: A CSCW-Grounded Methodology for Investigating Collaborative Competence of LLM Agents through Controlled Multi-Agent Experiments
- Title(参考訳): CollabSim: マルチエージェント実験によるLCMエージェントの協調能力調査のためのCSCW-Grounded Methodology
- Authors: Jiaju Chen, Bo Sun, Yuxuan Lu, Yun Wang, Dakuo Wang, Bingsheng Yao,
- Abstract要約: CollabSimは、理論に基づく協調能力の定義、相互作用条件の制御、エージェントの内部状態のアクションレベル探索を組み合わせたシミュレーションフレームワークである。
CollabSimは条件効果をキャプチャし、モデルパフォーマンスパターンを分離し、エージェント設計のタスク依存効果を明らかにする。
- 参考スコア(独自算出の注目度): 32.043112677406064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems (MAS) built on large language models have shown growing promise, with their effectiveness resting on agents' ability to coordinate through text-based channels much as human teams do. Yet recent study suggests that MAS often falter not because agents lack individual task-solving ability, but because they lack collaborative competence: the capacity to establish common ground, maintain shared task understanding, balance individual and collective incentives, and repair misalignment as interaction unfolds. Decades of research in Computer-Supported Cooperative Work have characterized these requirements for human teams coordinating under constrained communication, yet existing MAS evaluations focus mainly on task outcomes or single-agent proficiency in reasoning, planning, and tool use. To enable a systematic analysis of agents' collaborative competence in MAS, we introduce CollabSim, a configurable simulation framework that combines a theory-grounded definition of collaborative capabilities, controlled manipulation of interaction conditions, and action-level probing of agents' internal states. Experiments across four LLMs show that CollabSim can capture condition effects, separate model performance patterns, and reveal task-dependent effects of agent design.
- Abstract(参考訳): 大規模言語モデル上に構築されたマルチエージェントシステム(MAS)は、人間のチームと同じようにテキストベースのチャネルを介して協調するエージェントの能力によって、その効果が向上していることを示している。
しかし最近の研究では、エージェントは個別のタスク解決能力を欠いているためではなく、共通の基盤を確立し、共通のタスク理解を維持し、個人のインセンティブと集団のインセンティブをバランスさせ、相互作用が展開するにつれて不整合を修復する能力が欠如していることがしばしば示唆されている。
コンピュータ支援協調作業における長年の研究は、制約されたコミュニケーションの下で協調する人間チームに対するこれらの要求を特徴付けてきたが、既存のMAS評価は、主に推論、計画、ツール使用におけるタスク成果または単一エージェントの習熟度に焦点を当てている。
我々は,MASにおけるエージェントの協調能力の体系的解析を可能にするために,協調能力の理論的定義と相互作用条件の制御,エージェントの内部状態のアクションレベル探索を組み合わせた,構成可能なシミュレーションフレームワークであるCollabSimを紹介する。
4つのLCM実験により、CollabSimは条件効果を捉え、モデル性能パターンを分離し、エージェント設計のタスク依存効果を明らかにする。
関連論文リスト
- SynAgent: Generalizable Cooperative Humanoid Manipulation via Solo-to-Cooperative Agent Synergy [59.86199649493784]
制御可能な協調的ヒューマノイド操作は、インボディードインテリジェンスにとって根本的な問題である。
スケーラブルで物理的に妥当な協調操作を可能にするフレームワークであるSynAgentを提案する。
実験では、SynAgentは協調模倣と軌道条件制御の両方において既存のベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-04-20T17:46:20Z) - Can LLM Agents Solve Collaborative Tasks? A Study on Urgency-Aware Planning and Coordination [4.511923587827302]
大規模言語モデル(LLM)は、コミュニケーション、計画、推論において強力な能力を示している。
本研究は,マルチエージェント協調作業におけるLCMの強みと失敗モードに関する新たな知見を提供する。
論文 参考訳(メタデータ) (2025-08-20T11:44:10Z) - Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [50.657070334404835]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文 参考訳(メタデータ) (2024-12-20T09:21:15Z) - MetaAgents: Large Language Model Based Agents for Decision-Making on Teaming [27.911816995891726]
大規模言語モデル(LLM)を用いた社会シミュレーションフレームワークであるMetaAgentsを紹介する。
LLMをベースとしたエージェントのチーム構成とスキルマッチング行動を精査するためのケーススタディとして,ジョブフェア環境を構築した。
評価の結果,LLMをベースとしたエージェントが,効率的なチーム開発に合理的な決定を下す上で有能な役割を担っていることが示された。
論文 参考訳(メタデータ) (2023-10-10T10:17:58Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。