論文の概要: High Volatility and Action Bias Distinguish LLMs from Humans in Group Coordination
- arxiv url: http://arxiv.org/abs/2604.02578v1
- Date: Thu, 02 Apr 2026 23:21:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.242752
- Title: High Volatility and Action Bias Distinguish LLMs from Humans in Group Coordination
- Title(参考訳): 集団コーディネーションにおけるヒトの高ボラティリティと行動バイアスの識別
- Authors: Sahaj Singh Maini, Robert L. Goldstone, Zoran Tiganj,
- Abstract要約: 我々は,大言語モデル (LLMs) と人為的パフォーマンスを,不完全なモニタリングであるグループバイナリサーチと比較した。
我々の研究によると、LLMは時間とともに適応し、安定する人間とは異なり、ゲーム全体で改善せず、過度なスイッチングを示すことが多い。
- 参考スコア(独自算出の注目度): 3.6704226968275253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans exhibit remarkable abilities to coordinate in groups. As large language models (LLMs) become more capable, it remains an open question whether they can demonstrate comparable adaptive coordination and whether they use the same strategies as humans. To investigate this, we compare LLM and human performance on a common-interest game with imperfect monitoring: Group Binary Search. In this n-player game, participants need to coordinate their actions to achieve a common objective. Players independently submit numerical values in an effort to collectively sum to a randomly assigned target number. Without direct communication, they rely on group feedback to iteratively adjust their submissions until they reach the target number. Our findings show that, unlike humans who adapt and stabilize their behavior over time, LLMs often fail to improve across games and exhibit excessive switching, which impairs group convergence. Moreover, richer feedback (e.g., numerical error magnitude) benefits humans substantially but has small effects on LLMs. Taken together, by grounding the analysis in human baselines and mechanism-level metrics, including reactivity scaling, switching dynamics, and learning across games, we point to differences in human and LLM groups and provide a behaviorally grounded diagnostic for closing the coordination gap.
- Abstract(参考訳): 人間はグループで協調する素晴らしい能力を示す。
大規模言語モデル(LLM)がより有能になるにつれて、それらが同等の適応的調整を実証できるかどうか、そしてそれらが人間と同じ戦略を使用するかどうか、疑問が残る。
そこで本研究では,LLMと人為的パフォーマンスを,不完全なモニタリングであるグループバイナリサーチと比較した。
このn-playerゲームでは、参加者は共通の目的を達成するために行動を調整する必要がある。
プレイヤーはランダムに割り当てられたターゲット番号に合計するために、個別に数値を提出する。
直接的なコミュニケーションがなければ、ターゲット番号に到達するまで、グループフィードバックに頼って提出を反復的に調整する。
以上の結果から, LLMは時間とともに適応し, 安定する人間と異なり, ゲーム全体では改善せず, 過度にスイッチングし, 集団の収束を損なうことが示唆された。
さらに、よりリッチなフィードバック(例えば数値誤差等)は、人間に実質的に恩恵を与えるが、LLMにはほとんど影響しない。
同時に,リアクティビティスケーリング,ダイナミックススイッチング,ゲーム間の学習など,人間のベースラインとメカニズムレベルのメトリクスの分析を基盤として,人間とLLMグループの違いを指摘し,協調ギャップを閉じるための行動的根拠付き診断を行う。
関連論文リスト
- Tacit Coordination of Large Language Models [19.473278869118346]
シェリングの理論は、人が焦点に依存してどのように協調するかを説明する。
この研究は多言語モデル(LLM)を暗黙の調整ゲームにおけるプレイヤーとして研究している。
論文 参考訳(メタデータ) (2026-01-28T13:34:04Z) - Beyond Survival: Evaluating LLMs in Social Deduction Games with Human-Aligned Strategies [54.08697738311866]
Werewolfのようなソーシャル推論ゲームは、言語、推論、戦略を組み合わせている。
我々は,100時間以上のビデオ,32.4M発声トークン,15の規則変種を含む高品質で人間認証されたWerewolfデータセットをキュレートした。
本稿では,勝利派戦略を2段階の真理として活用する新たな戦略調整評価法を提案する。
論文 参考訳(メタデータ) (2025-10-13T13:33:30Z) - Who is a Better Player: LLM against LLM [53.46608216197315]
本稿では,大規模言語モデル (LLM) の総合的な性能を評価するための対戦型ベンチマークフレームワークを提案する。
広範にプレイされている5つのゲームをサポートし,20のLDMを駆使したプレーヤーを対象とする,特別な評価プラットフォームであるQi Townを紹介した。
論文 参考訳(メタデータ) (2025-08-05T06:41:47Z) - Corrupted by Reasoning: Reasoning Language Models Become Free-Riders in Public Goods Games [87.5673042805229]
大規模言語モデルは、アライメント、堅牢性、安全なデプロイメントを保証する上で、いかに自己関心と集合的幸福のバランスをとるかが重要な課題である。
我々は、行動経済学から制度的に選択した公共財ゲームに適応し、異なるLLMがいかに社会的ジレンマをナビゲートするかを観察することができる。
意外なことに、o1シリーズのようなLCMの推論は、協調にかなり苦労している。
論文 参考訳(メタデータ) (2025-06-29T15:02:47Z) - Humans expect rationality and cooperation from LLM opponents in strategic games [0.0]
本研究は,人間の行動の差異に着目した最初の金銭的インセンティブを持つ実験室実験の結果である。
この環境下では,LLMと対戦する被験者は人間よりも有意に少ない数を選択する。
この変化は、主に戦略的推論能力の高い被験者によって引き起こされる。
論文 参考訳(メタデータ) (2025-05-16T09:01:09Z) - Confidence-weighted integration of human and machine judgments for superior decision-making [1.4180680537405237]
大きな言語モデル(LLM)は、特定の予測タスクにおいて人間を上回ることができる。
1つの可能性として、人間はLSMよりも悪いパフォーマンスをしているにもかかわらず、チームで作業するときに価値を付加できる。
人間と機械のチームは、チームメンバーの自信が十分に調整されたときに、各チームメイトを追い越すことができます。
論文 参考訳(メタデータ) (2024-08-15T11:16:21Z) - The Wisdom of Partisan Crowds: Comparing Collective Intelligence in
Humans and LLM-based Agents [7.986590413263814]
パルチザンの知恵」は「パルチザンの知恵」として知られる現象である。
パルチザンの群衆は、人間のようなパルチザンの偏見を示すが、人間と同じように熟考を通じてより正確な信念に収束する。
コンバージェンスに干渉するいくつかの要因を同定する。例えば、チェーン・オブ・ソート・プロンプトの使用や、ペルソナにおける詳細の欠如などである。
論文 参考訳(メタデータ) (2023-11-16T08:30:15Z) - Do LLMs exhibit human-like response biases? A case study in survey
design [66.1850490474361]
大規模言語モデル(LLM)が人間の反応バイアスをどの程度反映しているかについて検討する。
アンケート調査では, LLMが人間のような応答バイアスを示すかどうかを評価するためのデータセットとフレームワークを設計した。
9つのモデルに対する総合的な評価は、一般のオープンかつ商用のLCMは、一般的に人間のような振る舞いを反映しないことを示している。
論文 参考訳(メタデータ) (2023-11-07T15:40:43Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。