論文の概要: Learning Perspectivist Social Meaning via Demographic-Conditioned Fusion Embeddings
- arxiv url: http://arxiv.org/abs/2606.07123v1
- Date: Fri, 05 Jun 2026 10:25:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.690592
- Title: Learning Perspectivist Social Meaning via Demographic-Conditioned Fusion Embeddings
- Title(参考訳): デモグラフィックによる融合埋め込みによるパースペクティビストの社会的意味の学習
- Authors: Amanda Cercas Curry, Lucio La Cava, Luca Maria Aiello, Gianmarco De Francisci Morales,
- Abstract要約: 言語における社会的意味は本質的にパースペクティブであり、アノテータの背景、人口統計、イデオロギー的な位置によって異なる。
ほとんどのNLPシステムは、解釈の多様性を無視して、この変化を1つの地平線ラベルに分解する。
我々は、パースペクティビストスペクトルに沿って社会的次元をモデル化し、28万の人間のアノテーションからなるデータセット上で、人口集団間で解釈がどのように異なるかを測定する。
- 参考スコア(独自算出の注目度): 11.048086031066624
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Social meaning in language is inherently perspectival, varying across annotator backgrounds, demographics, and ideological positions. However, most NLP systems collapse this variation into a single ground-truth label, ignoring the diversity of interpretations. In this work, we model social dimensions along a perspectivist spectrum, capturing how interpretations vary across demographic groups on a dataset consisting of 28k human annotations. We benchmark multiple modeling paradigms, including zero-shot, few-shot, and fine-tuned approaches, and propose fusion embeddings that integrate textual and demographic representations. Our fusion models yield consistent and statistically significant improvements over text-only baselines across all fusion strategies (+5.9-6.5% relative macro PR-AUC), with shuffle ablations confirming that demographic profiles carry genuine predictive signal rather than spurious correlations.
- Abstract(参考訳): 言語における社会的意味は本質的にパースペクティヴであり、アノテータの背景、人口統計、イデオロギー的な位置によって異なる。
しかし、ほとんどのNLPシステムは、解釈の多様性を無視して、この変化を1つの基底真実ラベルに分解する。
そこで本研究では,28kの人文アノテーションからなるデータセット上で,人口集団間での解釈の差異を抽出し,社会次元をパースペクティビストスペクトルに沿ってモデル化する。
我々は、ゼロショット、少数ショット、微調整のアプローチを含む複数のモデリングパラダイムをベンチマークし、テキストと階層表現を統合した融合埋め込みを提案する。
我々の融合モデルは、すべての融合戦略(+5.9-6.5%の相対マクロPR-AUC)において、テキストのみのベースラインに対して一貫した統計的に有意な改善をもたらす。
関連論文リスト
- The Ghost Annotator: a Framework to Explore Human Label Variation in Content Moderation through Conformal Prediction [39.10305114526259]
共形予測と協調フィルタリングスタイルのアノテータ表現を組み合わせたフレームワークを提案する。
非整合スコアを用いて、モデル予測が利用可能なすべてのアノテーションから発散するケースを定量化するために、ゴースト予測メトリックとゴーストアノテーション表現を導入する。
我々の発見は、アノテータの不一致によって全てのモデルの不確実性が増大する一方で、より大きなモデルは、人間のアノテーションと一致しないテキストの分類により自信を持つ傾向にあることを示している。
論文 参考訳(メタデータ) (2026-06-01T21:32:37Z) - Demographic Probing of Large Language Models Lacks Construct Validity [16.29607362682272]
大規模言語モデルが人口統計特性にどのように適応するかを考察する。
このアプローチは通常、グループメンバーシップのシグナルとして、分離された単一の人口統計学的キューを使用する。
その結果、同じ人口集団を表現するための手がかりは、モデル行動に部分的に重なる変化しか生じないことがわかった。
論文 参考訳(メタデータ) (2026-01-26T13:41:35Z) - Measuring Social Bias in Vision-Language Models with Face-Only Counterfactuals from Real Photos [79.03150233804458]
現実のイメージは人種と性別を混在させ、背景や衣服などの関連要因や属性を隠蔽する。
テキストのみの対実的評価パラダイムを提案する。
我々は、人種や性別に関連する顔属性のみを編集し、他の視覚的要素を全て固定することで、反事実的変異を生成する。
論文 参考訳(メタデータ) (2026-01-11T14:35:06Z) - Mitigating Bias with Words: Inducing Demographic Ambiguity in Face Recognition Templates by Text Encoding [18.08946802592489]
顔認識システムは、しばしば人口統計学的バイアスに起因し、部分的には、人口統計学的情報と、顔の埋め込みにおけるアイデンティティ関連の特徴が絡み合っているためである。
我々は,顔埋め込みにおける人口動態のあいまいさを誘発する新しい手法である統一テキスト・イメージ・埋め込み(UTIE)を提案する。
UTIEは、いくつかのケースにおいて、顔認証精度を維持しながら、あるいは改善しながら、常にバイアスメトリクスを減少させることを示す。
論文 参考訳(メタデータ) (2025-12-05T10:41:58Z) - Us-vs-Them bias in Large Language Models [0.569978892646475]
基礎的大言語モデル間で、一貫した内集団陽性および外集団陰性な関連を見いだす。
調査対象者は,保守的ペルソナは対人関係が強く,リベラルなペルソナは対人関係が強かった。
論文 参考訳(メタデータ) (2025-12-03T07:11:22Z) - MF-LLM: Simulating Population Decision Dynamics via a Mean-Field Large Language Model Framework [53.82097200295448]
MF-LLM(Mean-Field LLM)は,まず平均場理論を社会シミュレーションに取り入れる。
MF-LLMは反復過程を通じて個人と人口間の双方向相互作用をモデル化する。
IB-Tuneは、Information Bottleneckの原理にインスパイアされた、新しい微調整手法である。
論文 参考訳(メタデータ) (2025-04-30T12:41:51Z) - Robustness and Confounders in the Demographic Alignment of LLMs with Human Perceptions of Offensiveness [10.194622474615462]
大規模言語モデル(LLM)は人口統計学的バイアスを示すことが知られているが、複数のデータセットにまたがってこれらのバイアスを体系的に評価する研究は少ない。
以上の結果から、人口統計学的特徴、特に人種、影響のアライメントはデータセット間で矛盾し、しばしば他の要因と絡み合っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-11-13T19:08:23Z) - Leveraging Prototypical Representations for Mitigating Social Bias without Demographic Information [50.29934517930506]
DAFairは、言語モデルにおける社会的バイアスに対処する新しいアプローチである。
偏見を緩和するために、原型的人口統計テキストを活用し、微調整プロセス中に正規化用語を取り入れる。
論文 参考訳(メタデータ) (2024-03-14T15:58:36Z) - On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。
本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T19:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。