論文の概要: SCENE: Recognizing Social Norms and Sanctioning in Group Chats
- arxiv url: http://arxiv.org/abs/2605.07823v1
- Date: Fri, 08 May 2026 14:53:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.133841
- Title: SCENE: Recognizing Social Norms and Sanctioning in Group Chats
- Title(参考訳): SCENE:グループチャットにおける社会的規範と制裁の認識
- Authors: Mateusz Jacniacki, Maksymilian Bilski,
- Abstract要約: マルチパーティチャットにおける暗黙の規範と社会的制裁に焦点を当てたソーシャルインタラクションベンチマークであるSCENEを紹介する。
SCENEは、隠された規範に従うスクリプト付きペルソナで、もっともらしい非ロールプレイシナリオを生成する。
本稿では,2つの機能適応能力に対する行動評価指標を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online group chats are social spaces with implicit behavior patterns that, when broken, are often met with social sanctioning from the group. The ability and willingness of LLM-based agents to recognize and adapt to these norms remains mostly unexplored. We introduce SCENE, a social-interaction benchmark focused on implicit norms and social sanctioning in multi-party chat. SCENE generates plausible non-roleplay scenarios with scripted personas that follow a hidden norm, create opportunities for the subject agent to violate it, and sanction breaches when they occur. We further propose behavioral evaluation metrics for two functional adaptation abilities: responsiveness to negative sanctioning, and adapting norm from peers behavior. We evaluate six frontier and open-weight models on SCENE. Our results show that Claude Opus 4.7 and Gemini 3.1 Pro adapt to implicit norms significantly more than the evaluated open-weight models. SCENE contributes one benchmark in the direction of recent calls for dynamic, interactional evaluation of LLM social capabilities.
- Abstract(参考訳): オンライングループチャットは、暗黙の行動パターンを持つ社会的空間であり、壊れると、しばしばグループからの社会的制裁を受ける。
LLMをベースとしたエージェントがこれらの規範を認識し、適応する能力と意欲はほとんど未解明のままである。
マルチパーティチャットにおける暗黙の規範と社会的制裁に焦点を当てたソーシャルインタラクションベンチマークであるSCENEを紹介する。
SCENEは、隠された規範に従うスクリプト化されたペルソナによる、もっともらしい非ロールプレイシナリオを生成し、それを侵害する対象エージェントの機会を作成し、それらが発生した時に制裁違反を発生させる。
さらに,2つの機能適応能力に対する行動評価指標を提案する。
SCENEのフロンティアモデルとオープンウェイトモデルについて検討した。
以上の結果から,Claude Opus 4.7 と Gemini 3.1 Pro は,評価されたオープンウェイトモデルよりも暗黙のノルムにかなり適応していることがわかった。
SCENE は最近の LLM の社会的能力の動的・相互作用的評価の要求に対して,あるベンチマークを貢献している。
関連論文リスト
- Multi-Agent Systems Shape Social Norms for Prosocial Behavior Change [22.997945675889465]
本研究では,マルチエージェントシステムが寄付行動を促進するために「仮想社会規範」を確立できるかどうかを考察する。
その結果,マルチエージェントの相互作用は社会的規範や寄付意欲を効果的に増大させることが示唆された。
論文 参考訳(メタデータ) (2026-02-07T08:23:54Z) - SocialEval: Evaluating Social Intelligence of Large Language Models [70.90981021629021]
ソーシャルインテリジェンス(英語版) (SI) は、社会的目標を達成するために社会的相互作用をナビゲートする際に賢明に行動する対人能力を持つ人間を装備する。
結果指向の目標達成評価とプロセス指向の対人能力評価という,運用評価パラダイムを提示する。
スクリプトベースのバイリンガルSIベンチマークであるSocialEvalを提案する。
論文 参考訳(メタデータ) (2025-06-01T08:36:51Z) - EgoNormia: Benchmarking Physical Social Norm Understanding [52.87904722234434]
EGONORMIAは、安全性、プライバシ、プロキシ、丁寧さ、協力性、コーディネーション/プロアクティビティ、コミュニケーション/レポータビリティの7つの標準カテゴリにまたがる。
我々の研究は、現在の最先端のビジョン言語モデル(VLM)は、堅固な標準理解が欠如していることを示し、EGONORMIAでは最大54%、EGONORMIAでは65%と評価された。
論文 参考訳(メタデータ) (2025-02-27T19:54:16Z) - Emergent social conventions and collective bias in LLM populations [0.0]
社会的慣行は、個人が集団を形成する方法を形成する社会調整のバックボーンである。
大規模言語モデル(LLM)エージェントの分散集団における普遍的な社会慣行の自然発生を示す実験結果を示す。
そして、エージェントが個別にバイアスを示さない場合でも、このプロセス中に集団バイアスがどれだけ強く現れるかを示す。
論文 参考訳(メタデータ) (2024-10-11T16:16:38Z) - SocialBench: Sociality Evaluation of Role-Playing Conversational Agents [85.6641890712617]
大規模言語モデル(LLM)は、様々なAI対話エージェントの開発を進めてきた。
SocialBenchは、ロールプレイングの会話エージェントの社会的性を個人レベルとグループレベルで評価するために設計された最初のベンチマークである。
個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文 参考訳(メタデータ) (2024-03-20T15:38:36Z) - Emergence of Social Norms in Generative Agent Societies: Principles and Architecture [8.094425852451643]
生成型MASにおける社会的規範の出現を促進するために,CRSECという新しいアーキテクチャを提案する。
私たちのアーキテクチャは、創造と表現、スプレッド、評価、コンプライアンスの4つのモジュールで構成されています。
本実験は,生産型MASにおける社会的規範の確立と社会的対立の低減を図ったものである。
論文 参考訳(メタデータ) (2024-03-13T05:08:10Z) - Aligning to Social Norms and Values in Interactive Narratives [89.82264844526333]
我々は、インタラクティブな物語やテキストベースのゲームにおいて、社会的に有益な規範や価値観に沿って行動するエージェントを作成することに注力する。
我々は、特別な訓練を受けた言語モデルに存在する社会的コモンセンス知識を用いて、社会的に有益な値に整合した行動にのみ、その行動空間を文脈的に制限するGAALADエージェントを紹介した。
論文 参考訳(メタデータ) (2022-05-04T09:54:33Z) - Moral Stories: Situated Reasoning about Norms, Intents, Actions, and
their Consequences [36.884156839960184]
現代のNLGモデルが社会環境にデプロイされたシステムの行動優先度として機能するかどうかを検討する。
本研究では,「モラルストーリー」という,階層的,分枝的なナラティブのクラウドソーシングデータセットを導入し,基礎的,目標指向の社会推論の研究を行う。
論文 参考訳(メタデータ) (2020-12-31T17:28:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。