Fugu-MT 論文翻訳(概要): Analysing LLM Persona Generation and Fairness Interpretation in Polarised Geopolitical Contexts

論文の概要: Analysing LLM Persona Generation and Fairness Interpretation in Polarised Geopolitical Contexts

arxiv url: http://arxiv.org/abs/2603.22837v1
Date: Tue, 24 Mar 2026 06:19:48 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-25 19:53:37.329906
Title: Analysing LLM Persona Generation and Fairness Interpretation in Polarised Geopolitical Contexts
Title（参考訳）: 分極地政学的文脈におけるLLMペルソナ生成と公正解釈の解析
Authors: Maida Aizaz, Quang Minh Nguyen,
Abstract要約: パレスチナ語とイスラエル語で生成されたペルソナを5つのポピュラーな大言語モデル(LLM)で分析する。戦争状況におけるパレスチナ人のプロファイルは、社会経済的地位の低下と生存志向の役割と結びついていることが多いが、イスラエルのプロファイルは、主に中流階級のステータスと専門の専門的属性を保持している。推論トレースの解析は、モデル推論と生成の間の興味深いダイナミクスを明らかにする。
参考スコア（独自算出の注目度）: 7.192001578491251
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) are increasingly utilised for social simulation and persona generation, necessitating an understanding of how they represent geopolitical identities. In this paper, we analyse personas generated for Palestinian and Israeli identities by five popular LLMs across 640 experimental conditions, varying context (war vs non-war) and assigned roles. We observe significant distributional patterns in the generated attributes: Palestinian profiles in war contexts are frequently associated with lower socioeconomic status and survival-oriented roles, whereas Israeli profiles predominantly retain middle-class status and specialised professional attributes. When prompted with explicit instructions to avoid harmful assumptions, models exhibit diverse distributional changes, e.g., marked increases in non-binary gender inferences or a convergence toward generic occupational roles (e.g., "student"), while the underlying socioeconomic distinctions often remain. Furthermore, analysis of reasoning traces reveals an interesting dynamics between model reasoning and generation: while rationales consistently mention fairness-related concepts, the final generated personas follow the aforementioned diverse distributional changes. These findings illustrate a picture of how models interpret geopolitical contexts, while suggesting that they process fairness and adjust in varied ways; there is no consistent, direct translation of fairness concepts into representative outcomes.
Abstract（参考訳）: 大規模言語モデル(LLM)は、社会的シミュレーションやペルソナ生成にますます活用され、それらが地政学的アイデンティティをどのように表現しているかを理解する必要がある。本稿では,パレスチナとイスラエルのアイデンティティに関するペルソナを,640の実験条件,異なる状況(戦時対非戦時),割り当てられた役割の5つのLLMで分析する。戦争状況におけるパレスチナ人のプロファイルは、社会経済的地位と生存志向の役割にしばしば関連付けられ、イスラエルのプロファイルは、主に中流階級のステータスを保持し、専門的な属性を保持する。有害な仮定を避けるための明示的な指示によって、モデルが様々な分布の変化を示す場合、例えば、非二項性推論の顕著な増加や、一般的な職業的役割(例えば「学生」)への収束が示される。さらに、推論トレースの分析は、モデル推論と生成の間の興味深いダイナミクスを明らかにしている。これらの知見は、モデルがどのように地政学的文脈を解釈し、公平さを処理し、様々な方法で調整するかを示唆する。

関連論文リスト

Reasoning as State Transition: A Representational Analysis of Reasoning Evolution in Large Language Models [50.39102836928242]
モデルの内部状態の力学を研究するために,表現的視点を導入する。トレーニング後、静的な初期表現品質が限られた改善しか得られないことが判明した。
論文参考訳（メタデータ） (2026-01-31T15:23:33Z)
Demographic Probing of Large Language Models Lacks Construct Validity [16.29607362682272]
大規模言語モデルが人口統計特性にどのように適応するかを考察する。このアプローチは通常、グループメンバーシップのシグナルとして、分離された単一の人口統計学的キューを使用する。その結果、同じ人口集団を表現するための手がかりは、モデル行動に部分的に重なる変化しか生じないことがわかった。
論文参考訳（メタデータ） (2026-01-26T13:41:35Z)
Assessing the Reliability of LLMs Annotations in the Context of Demographic Bias and Model Explanation [5.907945985868999]
本研究では,アノテータの人口統計学的特徴がテキストコンテンツと比較してラベル決定に与える影響について検討した。一般化線形混合モデルを用いて、この差分率を定量化し、観測された分散のごく一部(8%)が人口統計因子であることを示した。次に、ジェネレーティブAI(GenAI)モデルの信頼性をアノテータとして評価し、人口統計学的パーソナによる指導が人間の判断との整合性を改善するかどうかを具体的に評価する。
論文参考訳（メタデータ） (2025-07-17T14:00:13Z)
Interpreting Social Bias in LVLMs via Information Flow Analysis and Multi-Round Dialogue Evaluation [1.7997395646080083]
大規模視覚言語モデル (LVLM) はマルチモーダルタスクにおいて顕著な進歩を遂げているが、社会的偏見も顕著である。本稿では,情報フロー解析と多ラウンド対話評価を組み合わせた説明フレームワークを提案する。実験により、LVLMは異なる人口集団の画像を処理する際に、情報利用の体系的な差異を示すことが明らかとなった。
論文参考訳（メタデータ） (2025-05-27T12:28:44Z)
Political Bias in LLMs: Unaligned Moral Values in Agent-centric Simulations [0.0]
モーラル・ファンデーション理論アンケートにおいて,パーソナライズされた言語モデルと人間の反応がどのように一致しているかを検討する。我々は、オープンソースの生成言語モデルを異なる政治的ペルソナに適応させ、これらのモデルを繰り返し調査し、合成データセットを生成する。解析の結果,モデルが複数の繰り返しにまたがって不整合な結果をもたらし,高い応答差が生じることがわかった。
論文参考訳（メタデータ） (2024-08-21T08:20:41Z)
The Factuality Tax of Diversity-Intervened Text-to-Image Generation: Benchmark and Fact-Augmented Intervention [61.80236015147771]
我々は多様性の介入とT2Iモデルにおける人口統計学的事実性とのトレードオフを定量化する。 DoFaiRの実験では、多様性指向の指示によって、性別や人種の異なる集団の数が増加することが明らかになった。本研究では,歴史における世代ごとのジェンダーや人種構成について,言語化された事実情報を反映したFact-Augmented Intervention (FAI)を提案する。
論文参考訳（メタデータ） (2024-06-29T09:09:42Z)
Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文参考訳（メタデータ） (2023-03-20T19:32:49Z)
Towards Understanding and Mitigating Social Biases in Language Models [107.82654101403264]
大規模事前訓練言語モデル(LM)は、望ましくない表現バイアスを示すのに潜在的に危険である。テキスト生成における社会的バイアスを軽減するためのステップを提案する。我々の経験的結果と人的評価は、重要な文脈情報を保持しながらバイアスを緩和する効果を示す。
論文参考訳（メタデータ） (2021-06-24T17:52:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。