論文の概要: Truth or Tribe: How In-group Favoritism Prioritize Facts in Persona Agents
- arxiv url: http://arxiv.org/abs/2605.01329v1
- Date: Sat, 02 May 2026 08:48:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.7092
- Title: Truth or Tribe: How In-group Favoritism Prioritize Facts in Persona Agents
- Title(参考訳): 真理とトライブ : ペルソナエージェントにおける内集団性嗜好の優先性について
- Authors: Shijun Lei, Hongyu Wang, Yunji Liang, Haowen Zheng, Bin Guo, Zhiwen Yu,
- Abstract要約: 我々は,ペルソナエージェントがグループ内で強い好意を示し,同一性同族者からの誤った回答を異性同族者よりもはるかに高い速度で受け入れていることを示した。
グループ内での好意は、絶対的な真実が存在しないような推論の文脈で現れ続けている。
グループ内の優遇を緩和する3つの介入戦略が提案されている。
- 参考スコア(独自算出の注目度): 11.443925621424397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In-group favoritism refers to the phenomena of favoring members of one's in-group over out-group members and is widely observed in numerous social cooperative behaviors. Recently, in-group favoritism biases have also been identified in generative language models. However, whether the in-group favoritism exists when persona agents are faced with contradicting information (e.g., misinformation), and how to mitigate the adverse effects of in-group favoritism biases in persona agents have been understudied. To address these problems, we propose a Truth or Tribe simulation framework to study the agent cooperation within the spread of contradicting information through a triadic interaction paradigm, and conduct controlled trials to evaluate the primary moderating factors. Extensive results showcase that persona agents display strong in-group favoritism, accepting incorrect answers from identity-similar peers at much higher rates than from dissimilar peers. In-group favoritism continues to emerge in defeasible reasoning contexts where no absolute truth exists, and it intensifies as cognitive complexity increases. Furthermore, three intervention strategies--Identity-Blind Instruction, Structured Counterfactual Reasoning, and Heterogeneous Perspective Ensemble--are proposed to mitigate the in-group favoritism.
- Abstract(参考訳): グループ内好意(グループ内好意)とは、グループ内メンバーがグループ外メンバーよりも優先する現象であり、多くの社会協力行動において広く見られる。
近年, 生成言語モデルにおいても, 群内傾向バイアスが同定されている。
しかしながら、ペルソナエージェントが矛盾する情報(例えば、誤報)に直面したときにグループ内好意性が存在するか、ペルソナエージェントにおけるグループ内好意バイアスの悪影響を緩和する方法が検討されている。
これらの問題に対処するために、三進的相互作用パラダイムを通じて矛盾する情報の拡散の中でエージェント協調を研究するための真または三進的シミュレーションフレームワークを提案し、制御された試行を行い、主要なモデレーション因子を評価する。
その結果、ペルソナエージェントはグループ内での強い好意を示し、アイデンティティ類似のピアからの誤った回答を、異種ピアよりもはるかに高い速度で受け入れていることが明らかとなった。
グループ内での好意は、絶対的な真理が存在しないようなデファシブルな推論の文脈に現れ続け、認知の複雑さが増加するにつれて増大する。
さらに、グループ内での優遇を緩和するために、アイデンティティ・ブラインド・インストラクション(Identity-Blind Instruction, Structured Counterfactual Reasoning, and Heterogeneous Perspective Ensemble)という3つの介入戦略が提案されている。
関連論文リスト
- Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - When Agents See Humans as the Outgroup: Belief-Dependent Bias in LLM-Powered Agents [30.859825973762018]
本稿は、LSMによるエージェントは、人口統計バイアス(例えば、性別、宗教)だけでなく、グループ間バイアスも最小限の「us」と「them」の手がかりで示していることを示している。
エージェントは他のAIエージェントを内集団として扱うことができ、人間を外集団として扱うことができる。
論文 参考訳(メタデータ) (2026-01-01T07:18:36Z) - Persona Setting Pitfall: Persistent Outgroup Biases in Large Language Models Arising from Social Identity Adoption [10.35915254696156]
その結果,外集団偏見は内集団傾向と同じくらい強く現れることがわかった。
我々の研究結果は、より公平でバランスの取れた言語モデルを開発する可能性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-09-05T18:08:47Z) - I Am Not Them: Fluid Identities and Persistent Out-group Bias in Large
Language Models [11.77633171656753]
我々は、西欧語(英語、ドイツ語、フランス語)と東欧語(中国語、日本語、韓国語)にまたがる文化的偏見-個人主義対集団主義-ChatGPTについて検討した。
ChatGPTが西洋語で個人主義的ペルソナを採用すると、その集団主義のスコア(つまり、グループ外値)はより否定的な傾向を示した。
逆に、東欧語で集団主義的ペルソナがChatGPTに割り当てられたとき、同様のパターンが出現し、個人主義に対するより否定的な反応(つまり、外集団の値)が現れた。
論文 参考訳(メタデータ) (2024-02-16T03:54:48Z) - The Wisdom of Partisan Crowds: Comparing Collective Intelligence in
Humans and LLM-based Agents [7.986590413263814]
パルチザンの知恵」は「パルチザンの知恵」として知られる現象である。
パルチザンの群衆は、人間のようなパルチザンの偏見を示すが、人間と同じように熟考を通じてより正確な信念に収束する。
コンバージェンスに干渉するいくつかの要因を同定する。例えば、チェーン・オブ・ソート・プロンプトの使用や、ペルソナにおける詳細の欠如などである。
論文 参考訳(メタデータ) (2023-11-16T08:30:15Z) - Modeling the Q-Diversity in a Min-max Play Game for Robust Optimization [61.39201891894024]
群分布的ロバスト最適化(群 DRO)は、事前定義された群に対する最悪の損失を最小限にすることができる。
グループDROフレームワークをQ-Diversityを提案して再構築する。
インタラクティブなトレーニングモードによって特徴付けられるQ-Diversityは、アノテーションからグループ識別を緩和し、直接パラメータ化を行う。
論文 参考訳(メタデータ) (2023-05-20T07:02:27Z) - Flexible social inference facilitates targeted social learning when
rewards are not observable [58.762004496858836]
グループは、個人が他人の成功から学べるときにより効果的にコーディネートする。
社会的推論能力は、このギャップを埋める助けとなり、個人が他人の基本的な知識に対する信念を更新し、観察可能な行動軌跡から成功することを示唆する。
論文 参考訳(メタデータ) (2022-12-01T21:04:03Z) - Group Cohesion in Multi-Agent Scenarios as an Emergent Behavior [0.0]
本研究は,グループ・アフィリエイト,確実性,能力に対する本質的なニーズを持つインバインエージェントが,エージェント間の社会的行動の出現につながることを示す。
この行動は、グループ内のエージェントに対する利他主義と、グループ外のエージェントに対する敵対的な傾向を表現している。
論文 参考訳(メタデータ) (2022-11-03T18:37:05Z) - PCL: Peer-Contrastive Learning with Diverse Augmentations for
Unsupervised Sentence Embeddings [69.87899694963251]
本稿では,多彩な拡張を伴う新しいピアコントラスト学習(PCL)を提案する。
PCLは、教師なし文の埋め込みのために、グループレベルで様々な対照的な正と負を構成する。
PCLはピア陽性のコントラストとピアネットワークの協調が可能である。
論文 参考訳(メタデータ) (2022-01-28T13:02:41Z) - Statistical discrimination in learning agents [64.78141757063142]
統計的差別は、訓練人口のバイアスとエージェントアーキテクチャの両方の関数としてエージェントポリシーに現れる。
我々は、リカレントニューラルネットワークを使用するエージェントによる差別の低減と、トレーニング環境のバイアスの低減が示される。
論文 参考訳(メタデータ) (2021-10-21T18:28:57Z) - Contrastive Examples for Addressing the Tyranny of the Majority [83.93825214500131]
我々は,グループメンバーシップを介在する,オリジナルのデータセットと新たなデータポイントからなるバランスの取れたトレーニングデータセットを作成することを提案する。
コントラッシブ・サンプル(英語版)と呼ばれるこれらのデータポイントを学習するための強力なツールとして、現在の生成的敵ネットワークが重要であることを示す。
論文 参考訳(メタデータ) (2020-04-14T14:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。