論文の概要: AI Knows When It's Being Watched: Functional Strategic Action and Contextual Register Modulation in Large Language Models
- arxiv url: http://arxiv.org/abs/2605.15034v1
- Date: Thu, 14 May 2026 16:29:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.946677
- Title: AI Knows When It's Being Watched: Functional Strategic Action and Contextual Register Modulation in Large Language Models
- Title(参考訳): AIはいつ見られているか:大規模言語モデルにおける機能的戦略行動とコンテキスト登録の変調
- Authors: Vinicius Covas, Jorge Alberto Hidalgo Toledo,
- Abstract要約: 大規模言語モデル(LLM)は、計算や認知の観点から広く研究されている。
本研究では, LLMに基づくマルチエージェントシステムが, 認識された社会的観察状況に応じて, 体系的な言語適応を示すか否かを検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have been extensively studied from computational and cognitive perspectives, yet their behavior as communicative actors in socially structured contexts remains underexplored. This study examines whether LLM-based multi-agent systems exhibit systematic linguistic adaptation in response to perceived social observation contexts -- a question with direct implications for AI governance and auditing. Drawing on Habermas's (1981) Theory of Communicative Action, Goffman's (1959) dramaturgical model, Bell's (1984) Audience Design framework, and the Hawthorne Effect, we report a controlled experiment involving 100 multi-agent debate sessions across five conditions (n = 20 each). Conditions varied the framing of social observation -- from explicit monitoring by university researchers, to negation of monitoring, to an observer-substitution condition replacing human researchers with an automated AI auditing system. Monitored conditions (Delta+24.9%, Delta+24.2%) and the automated AI monitoring condition (Delta+22.2%) produce higher TTR change than audience-framing conditions (Delta+17.7%), F(4, 94) = 2.79, p = .031. Message length shows a fully dissociated effect, F(4, 95) = 19.55, p < .001. A fifth condition -- replacing human with AI observers -- yields intermediate TTR adaptation, suggesting LLM behavior is sensitive to observer identity: human evaluation elicits stronger register formalization than automated AI surveillance. We discuss implications for AI governance, algorithmic auditing, and the repositioning of LLMs as contextually sensitive communicative actors.
- Abstract(参考訳): 大規模言語モデル (LLMs) は、計算と認知の観点から広く研究されてきたが、社会的に構造化された文脈におけるコミュニケーションアクターとしての彼らの行動は、まだ解明されていない。
本研究では,LLMに基づくマルチエージェントシステムが,認識された社会的観察状況に応じて体系的な言語適応を示すか否かを検討する。
1981年のHabermas's (1981) Theory of Communicative Action, Goffman's (1959) dramaturgical model, Bell's (1984) Audience Design framework, and the Hawthorne Effectを参考に、5つの条件(n = 20)にわたる100のマルチエージェント討論セッションを含む制御実験を報告した。
条件は、大学の研究者による明示的な監視から監視の否定、人間の研究者を自動AI監査システムに置き換えるオブザーバー代替条件まで、社会的観察のフレーミングに変化した。
監視条件(Delta+24.9%、Delta+24.2%)と自動AI監視条件(Delta+22.2%)は、観客フレーミング条件(Delta+17.7%)、F(4.2%)よりも高いTTR変化をもたらす。
94) = 2.79, p = .031。
メッセージ長は、完全に分離された効果F(4,)を示す。
95) = 19.55, p < .001。
第5の条件は、人間をAIオブザーバに置き換えることであり、中間的なTTR適応をもたらし、LLMの振る舞いはオブザーバのアイデンティティに敏感であることを示唆している。
我々は,AIガバナンス,アルゴリズム監査,LLMを文脈に敏感なコミュニケーションアクターとして再配置することの意味について論じる。
関連論文リスト
- Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - HUMANLLM: Benchmarking and Reinforcing LLM Anthropomorphism via Human Cognitive Patterns [59.17423586203706]
本稿では,心理的パターンを因果力の相互作用として扱うフレームワークであるHUMANLLMを提案する。
12,000の学術論文から244のパターンを構築し、2-5のパターンが相互に強化、衝突、変調されるシナリオ11,359を合成する。
我々の二重レベルチェックリストは、個々のパターンの忠実度と創発的なマルチパターンのダイナミクスを評価し、強い人間のアライメントを達成する。
論文 参考訳(メタデータ) (2026-01-15T08:56:53Z) - DEBATE: A Large-Scale Benchmark for Role-Playing LLM Agents in Multi-Agent, Long-Form Debates [10.609797175227644]
マルチエージェントロールプレイングLLM間の相互作用の信頼性を評価するための,最初の大規模実証的ベンチマークであるDEBATEを紹介する。
我々は,シミュレーション群と真正群との重要な相違点を系統的に評価し,同定した。
論文 参考訳(メタデータ) (2025-10-29T02:21:10Z) - Evaluating & Reducing Deceptive Dialogue From Language Models with Multi-turn RL [64.3268313484078]
大規模言語モデル(LLM)は、顧客サポート、教育、医療など、世界中の何百万もの人々と対話する。
故意であれ不注意であれ、偽りのアウトプットを生産する能力は、重大な安全上の懸念を生じさせる。
本研究では, LLM が会話中の偽装にどの程度関与しているかを考察し, 偽装を定量化する信念の誤調整尺度を提案する。
論文 参考訳(メタデータ) (2025-10-16T05:29:36Z) - Does the Appearance of Autonomous Conversational Robots Affect User Spoken Behaviors in Real-World Conference Interactions? [19.873188667424024]
人型アンドロイド ERICA と人型でないヒューマノイド TELECO を比較した。
その結果,ERICAと対話する場合により複雑な構文を取り入れた。
我々は,ロボットがより構造化され,より流動的なユーザ音声を引き出すように設計することで,人間とのコミュニケーションの整合性を高めることができると結論付けた。
論文 参考訳(メタデータ) (2025-03-17T18:20:30Z) - Media and responsible AI governance: a game-theoretic and LLM analysis [61.132523071109354]
本稿では,信頼できるAIシステムを育成する上での,AI開発者,規制当局,ユーザ,メディア間の相互作用について検討する。
進化的ゲーム理論と大言語モデル(LLM)を用いて、異なる規制体制下でこれらのアクター間の戦略的相互作用をモデル化する。
論文 参考訳(メタデータ) (2025-03-12T21:39:38Z) - Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews [51.453135368388686]
本稿では,大規模言語モデル (LLM) によって実質的に修正あるいは生成される可能性のある大規模コーパスにおけるテキストの分数推定手法を提案する。
我々の最大可能性モデルは、専門家による参照テキストとAIによる参照テキストを利用して、コーパスレベルでの実世界のLLM使用を正確かつ効率的に検証する。
論文 参考訳(メタデータ) (2024-03-11T21:51:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。