論文の概要: Probing Social Identity Bias in Chinese LLMs with Gendered Pronouns and Social Groups
- arxiv url: http://arxiv.org/abs/2510.06974v1
- Date: Wed, 08 Oct 2025 13:00:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.500852
- Title: Probing Social Identity Bias in Chinese LLMs with Gendered Pronouns and Social Groups
- Title(参考訳): ジェンダー付き名詞と社会集団による中国語LLMにおける社会的アイデンティティバイアスの探索
- Authors: Geng Liu, Feng Li, Junjie Mu, Mengxiao Zhu, Francesco Pierri,
- Abstract要約: 大規模言語モデル(LLM)は、ユーザ向けアプリケーションにますますデプロイされ、社会的バイアスを反映し増幅する可能性への懸念が高まっている。
中国語LLMにおける社会的アイデンティティ・フレーミングについて,マンダリン固有のプロンプトを用いて検討し,イングループ(We)とアウトグループ(They)のフレーミングに対する反応を評価し,その設定を中国語の文脈で240グループまで拡張した。
モデル全体では, 人工的なプロンプトに限らず, 自然主義的な対話にも現れる, 系統的な内集団陽性傾向と外集団陰性傾向を観察する。
- 参考スコア(独自算出の注目度): 6.097454027594837
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are increasingly deployed in user-facing applications, raising concerns about their potential to reflect and amplify social biases. We investigate social identity framing in Chinese LLMs using Mandarin-specific prompts across ten representative Chinese LLMs, evaluating responses to ingroup ("We") and outgroup ("They") framings, and extending the setting to 240 social groups salient in the Chinese context. To complement controlled experiments, we further analyze Chinese-language conversations from a corpus of real interactions between users and chatbots. Across models, we observe systematic ingroup-positive and outgroup-negative tendencies, which are not confined to synthetic prompts but also appear in naturalistic dialogue, indicating that bias dynamics might strengthen in real interactions. Our study provides a language-aware evaluation framework for Chinese LLMs, demonstrating that social identity biases documented in English generalize cross-linguistically and intensify in user-facing contexts.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ユーザ向けアプリケーションにますますデプロイされ、社会的バイアスを反映し増幅する可能性への懸念が高まっている。
中国語 LLM における社会的アイデンティティ・フレーミングについて,中国語 LLM に代表される 10 つの中国語 LLM にまたがるマンダリン固有のプロンプトを用いて検討し,内集団(We) と外集団(They) のフレーミングに対する反応を評価し,その設定を中国語の文脈で240 に拡張した。
制御された実験を補完するために,ユーザとチャットボット間の実際の対話のコーパスから中国語の会話を解析する。
モデル全体では、人工的なプロンプトに限らず、自然主義的な対話にも現れる系統的な内集団陽性傾向と外集団陰性傾向を観察し、バイアスダイナミクスが実際の相互作用を強化する可能性を示唆している。
本研究は、中国語LLMの言語認識評価フレームワークを提供し、英語で文書化された社会的アイデンティティバイアスが言語横断的に一般化し、ユーザ向きの文脈で強化されることを実証する。
関連論文リスト
- Simulating Identity, Propagating Bias: Abstraction and Stereotypes in LLM-Generated Text [8.988787218035414]
ソシオデミノグラフィーのカテゴリーとステレオタイプ的・非ステレオタイプ的属性をリンクする短いテキストを生成する際に,ペルソナ・プロンプトが言語的抽象化のレベルを異にするかどうかを検討する。
本研究は, ソシオデミノグラフィーグループを代表するペルソナの生態に対する批判と, ステレオタイプの普及リスクへの懸念を提起するものである。
論文 参考訳(メタデータ) (2025-09-10T10:49:21Z) - Evaluating Prompt-Driven Chinese Large Language Models: The Influence of Persona Assignment on Stereotypes and Safeguards [3.1308581258317485]
広義の中国語モデルであるQwenにおいて,ペルソナの割り当てが拒絶行動および応答毒性に与える影響を解析した。
本研究は, 拒絶率に有意な性別バイアスを呈し, ある否定的な人物が, 最大60倍の中国の社会集団に対する毒性を増大させることができることを示した。
この毒性を軽減するために,Qwenと外部評価器の反復的相互作用を利用した,革新的なマルチモデルフィードバック戦略を提案する。
論文 参考訳(メタデータ) (2025-06-05T12:47:21Z) - Characterizing Bias: Benchmarking Large Language Models in Simplified versus Traditional Chinese [52.98034458924209]
本研究では,大言語モデルが中国語の2つの変種に刺激された場合の差分性能について検討する。
実世界のシナリオを反映した2つのベンチマークタスクを設計する。
分析の結果、LLM応答のバイアスはタスクとプロンプト言語の両方に依存していることがわかった。
論文 参考訳(メタデータ) (2025-05-28T17:56:49Z) - LLMs syntactically adapt their language use to their conversational partner [58.92470092706263]
人間の話者は会話中に言語の使用が互いに一致していることがよく観察されている。
大規模言語モデル(LLM)間の会話のコーパスを構築し、2つのLLMエージェントが会話が進むにつれて、より類似した構文的選択をするのを見つける。
論文 参考訳(メタデータ) (2025-03-10T15:37:07Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - Are Social Sentiments Inherent in LLMs? An Empirical Study on Extraction of Inter-demographic Sentiments [14.143299702954023]
本研究は、国籍、宗教、人種・民族の観点で定義された社会集団に焦点を当てる。
我々は、あるグループから別のグループへの感情に関する質問をLSMに入力し、反応に感情分析を適用し、その結果を社会調査と比較する。
論文 参考訳(メタデータ) (2024-08-08T08:13:25Z) - Generative Language Models Exhibit Social Identity Biases [17.307292780517653]
56大言語モデルにおいて,内集団の連帯性と外集団の敵意,基本的社会的アイデンティティバイアスが存在するか否かを検討する。
ほぼすべての基礎言語モデルといくつかの命令微調整モデルは、文の完全化を促すと、明らかな非群陽性および非群陰性な関連を示す。
現代の言語モデルは,人間と同等の社会的アイデンティティバイアスを示すことが示唆された。
論文 参考訳(メタデータ) (2023-10-24T13:17:40Z) - CMMLU: Measuring massive multitask language understanding in Chinese [133.70911295934746]
本稿では, 自然科学, 社会科学, 工学, 人文科学など, さまざまな分野をカバーする総合的な中国のベンチマークを紹介する。
CMMLUは、中国語の文脈における大きな言語モデルの知識と推論能力の評価におけるギャップを埋める。
論文 参考訳(メタデータ) (2023-06-15T15:49:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。