論文の概要: Representational Harms in LLM-Generated Narratives Against Global Majority Nationalities
- arxiv url: http://arxiv.org/abs/2604.22749v1
- Date: Fri, 24 Apr 2026 17:49:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.550181
- Title: Representational Harms in LLM-Generated Narratives Against Global Majority Nationalities
- Title(参考訳): グローバル・マジョリティ・ナラティヴズにおける表現のハーム
- Authors: Ilana Nguyen, Harini Suresh, Thema Monroe-White, Evan Shieh,
- Abstract要約: 広範に学習された大言語モデル(LLM)による民族起源のアイデンティティの表現について検討する。
本研究は, 有害なステレオタイプ, 消去, グローバルマジョリティの1次元的特徴を含む, 国家起源による持続的表現的害の存在を示唆するものである。
米国国籍の手がかりを米国以外の国籍に置き換える場合でも、米国中心の偏見は持続するので、我々が特定する損害は、薬局を通じて説明できないことが分かっています。
- 参考スコア(独自算出の注目度): 1.5371856226502076
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language models (LLMs) are increasingly used for text generation tasks from everyday use to high-stakes enterprise and government applications, including simulated interviews with asylum seekers. While many works highlight the new potential applications of LLMs, there are risks of LLMs encoding and perpetuating harmful biases about non-dominant communities across the globe. To better evaluate and mitigate such harms, more research examining how LLMs portray diverse individuals is needed. In this work, we study how national origin identities are portrayed by widely-adopted LLMs in response to open-ended narrative generation prompts. Our findings demonstrate the presence of persistent representational harms by national origin, including harmful stereotypes, erasure, and one-dimensional portrayals of Global Majority identities. Minoritized national identities are simultaneously underrepresented in power-neutral stories and overrepresented in subordinated character portrayals, which are over fifty times more likely to appear than dominant portrayals. The degree of harm is amplified when US nationality cues (e.g., ``American'') are present in input prompts. Notably, we find that the harms we identify cannot be explained away via sycophancy, as US-centric biases persist even when replacing US nationality cues with non-US national identities in the prompts. Based on our findings, we call for further exploration of cultural harms in LLMs through methodologies that center Global Majority perspectives and challenge the uncritical adoption of US-based LLMs for the classification, surveillance, and misrepresentation of the majority of our planet.
- Abstract(参考訳): 大規模言語モデル (LLMs) は、日々の使用から、亡命希望者への模擬インタビューを含む、ハイテイクな企業や政府アプリケーションまで、テキスト生成タスクにますます利用されている。
多くの研究がLSMの新たな応用の可能性を浮き彫りにしているが、世界中の非支配的なコミュニティに対する有害な偏見を符号化し、持続する危険性がある。
このような害を適切に評価し緩和するためには、LSMが多様な個人をどう描写するかを研究する必要がある。
本研究では,オープンエンドな物語生成のプロンプトに応答して,民族的起源のアイデンティティが広く認識されたLLMによってどのように表現されるかを検討する。
本研究は, 有害なステレオタイプ, 消去, グローバルマジョリティの1次元的特徴を含む, 国家起源による持続的表現的害の存在を示唆するものである。
美濃化国家のアイデンティティは、権力中立の物語では同時に過小評価され、支配的な描写よりも50倍以上の頻度で、従属的な人物描写では過小評価される。
害の程度は、米国国籍の手がかり(e g , ``American'')が入力プロンプトに存在するときに増幅される。
特に、米国国籍を非米国国籍に置き換える場合でも、米国中心の偏見が持続するので、我々が特定する損害は、梅毒によって説明できないことが分かっています。
我々は,LLMの文化的被害のさらなる探究をグローバル・マジョリティの観点から進め,地球の大部分の分類・監視・誤表現のために米国を基盤とするLLMの非クリティカルな採用に挑戦する方法論を通じて求めている。
関連論文リスト
- Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - Exploring Changes in Nation Perception with Nationality-Assigned Personas in LLMs [0.0]
LLMとペルソナの組み合わせは、西欧諸国が好む傾向にある。
国民的パーソナリティは、LLMの行動にもっと焦点を当て、国家的パーソナの地域をより好意的に扱うように促す。
東ヨーロッパ、ラテンアメリカ、アフリカ諸国は、異なる国籍の人格によってより否定的に扱われる。
論文 参考訳(メタデータ) (2024-06-20T04:44:20Z) - Laissez-Faire Harms: Algorithmic Biases in Generative Language Models [0.0]
そこで本研究では,最も広範に普及しているLMの5つのテキストから合成されたテキストが,未成年者に対する脱落,従属化,ステレオタイピングの被害を永久に及ぼしていることを示す。
我々は、そのような個人が、LM生成出力に遭遇する確率が数百から数千倍にも達するほど、偏見の証拠が広範囲にあることを発見した。
本研究は,言語モデルによる差別的被害から消費者を守るための緊急の必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-04-11T05:09:03Z) - ALERT: A Comprehensive Benchmark for Assessing Large Language Models' Safety through Red Teaming [64.86326523181553]
ALERTは、新しいきめ細かいリスク分類に基づいて安全性を評価するための大規模なベンチマークである。
脆弱性を特定し、改善を通知し、言語モデルの全体的な安全性を高めることを目的としている。
論文 参考訳(メタデータ) (2024-04-06T15:01:47Z) - A Chinese Dataset for Evaluating the Safeguards in Large Language Models [46.43476815725323]
大型言語モデル(LLM)は有害な応答を生み出す。
本稿では,中国のLLMの安全性評価のためのデータセットを提案する。
次に、偽陰性例と偽陽性例をよりよく識別するために使用できる他の2つのシナリオに拡張する。
論文 参考訳(メタデータ) (2024-02-19T14:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。