論文の概要: Cross-Cultural Value Awareness in Large Vision-Language Models
- arxiv url: http://arxiv.org/abs/2604.09945v1
- Date: Fri, 10 Apr 2026 22:53:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.759109
- Title: Cross-Cultural Value Awareness in Large Vision-Language Models
- Title(参考訳): 大規模視覚言語モデルにおける文化的価値認識
- Authors: Phillip Howard, Xin Su, Kathleen C. Fraser,
- Abstract要約: 画像に描かれた文化的文脈が、LVLMが人の道徳的、倫理的、政治的価値について行う判断にどのように影響するかを考察する。
評価枠組みは, モラル基礎理論, 語彙分析, 表現された文化的文脈に対する生成価値の感度を用いて, LVLMによる文化的価値の差異の認識を診断する。
- 参考スコア(独自算出の注目度): 13.476728526770023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid adoption of large vision-language models (LVLMs) in recent years has been accompanied by growing fairness concerns due to their propensity to reinforce harmful societal stereotypes. While significant attention has been paid to such fairness concerns in the context of social biases, relatively little prior work has examined the presence of stereotypes in LVLMs related to cultural contexts such as religion, nationality, and socioeconomic status. In this work, we aim to narrow this gap by investigating how cultural contexts depicted in images influence the judgments LVLMs make about a person's moral, ethical, and political values. We conduct a multi-dimensional analysis of such value judgments in five popular LVLMs using counterfactual image sets, which depict the same person across different cultural contexts. Our evaluation framework diagnoses LVLM awareness of cultural value differences through the use of Moral Foundations Theory, lexical analyses, and the sensitivity of generated values to depicted cultural contexts.
- Abstract(参考訳): 近年の大規模視覚言語モデル(LVLM)の急速な普及は、有害な社会的ステレオタイプを強化することによる公正性の懸念の高まりを伴っている。
社会的偏見の文脈において、このような公平さの懸念に顕著な注意が払われているが、宗教、国籍、社会経済的地位といった文化的文脈に関連するLVLMのステレオタイプの存在について、比較的以前の研究はほとんど研究されていない。
本研究は,LVLMが人の道徳的,倫理的,政治的価値について行う判断に,イメージに表される文化的文脈がどのような影響を及ぼすかを検討することによって,このギャップを狭めることを目的とする。
我々は,5つの人気のあるLVLMにおいて,その価値判断の多次元的解析を行う。
評価枠組みは, モラル基礎理論, 語彙分析, 表現された文化的文脈に対する生成価値の感度を用いて, LVLMによる文化的価値の差異の認識を診断する。
関連論文リスト
- Cultural Counterfactuals: Evaluating Cultural Biases in Large Vision-Language Models with Counterfactual Examples [13.476728526770023]
文化バイアスを測定する上で重要な課題は、個人が属するグループを決定することは、しばしば画像の文化的文脈に依存することである。
本稿では,宗教,国籍,社会経済的地位に関連する文化的バイアスを測定するために,60k近い反事実画像を含む高品質な合成データセットについて紹介する。
論文 参考訳(メタデータ) (2026-03-02T20:19:53Z) - From Word to World: Evaluate and Mitigate Culture Bias in LLMs via Word Association Test [50.51344198689069]
我々は,人中心語関連テスト(WAT)を拡張し,異文化間認知による大規模言語モデルのアライメントを評価する。
文化選好に対処するために,モデルの内部表現空間に直接,文化固有の意味的関連性を直接埋め込む革新的なアプローチであるCultureSteerを提案する。
論文 参考訳(メタデータ) (2025-05-24T07:05:10Z) - From Surveys to Narratives: Rethinking Cultural Value Adaptation in LLMs [62.9861554207279]
LLM(Large Language Models)における文化的価値の適応は大きな課題である。
これまでの作業は主に、World Values Survey (WVS)データを使用して、LLMをさまざまな文化的価値と整合させる。
我々は,文化価値適応のためのWVSベースのトレーニングについて検討し,調査データのみに頼って文化規範を実践し,事実知識に干渉することを発見した。
論文 参考訳(メタデータ) (2025-05-22T09:00:01Z) - Cultural Learning-Based Culture Adaptation of Language Models [70.1063219524999]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。
文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文 参考訳(メタデータ) (2025-04-03T18:16:26Z) - Beyond Words: Exploring Cultural Value Sensitivity in Multimodal Models [26.051898880298126]
文化的文脈に基づく大規模言語モデルにおける価値アライメントの調査は、重要な研究領域となっている。
同様のバイアスは、大きな視覚言語モデル(VLM)では広く研究されていない。
論文 参考訳(メタデータ) (2025-02-18T19:03:02Z) - Through the Prism of Culture: Evaluating LLMs' Understanding of Indian Subcultures and Traditions [9.331687165284587]
インド社会におけるリトル・トラディションを認識し,正確に応答する大規模言語モデルの能力を評価する。
一連のケーススタディを通じて、LLMが支配的なグレートトラディションとローカライズされたリトルトラディションの相互作用のバランスをとることができるかどうかを評価する。
その結果,LLMは文化的ニュアンスを表現できる能力を示す一方で,実践的,文脈特異的なシナリオにこの理解を適用するのに苦慮していることが明らかとなった。
論文 参考訳(メタデータ) (2025-01-28T06:58:25Z) - CultureVLM: Characterizing and Improving Cultural Understanding of Vision-Language Models for over 100 Countries [63.00147630084146]
視覚言語モデル(VLM)は高度な人間とAIの相互作用を持つが、文化的な理解に苦慮している。
CultureVerseは大規模なマルチモーダルベンチマークで、682の文化的概念、188の国/地域、15の文化的概念、3の質問タイプをカバーしている。
本稿では,文化理解の大幅な向上を実現するために,我々のデータセットを微調整したVLMのシリーズであるCultureVLMを提案する。
論文 参考訳(メタデータ) (2025-01-02T14:42:37Z) - Large Language Models as Mirrors of Societal Moral Standards [0.5852077003870417]
言語モデルは、限られた範囲において、様々な文化的文脈において道徳的規範を表現することができる。
本研究は,40か国以上の道徳的視点を包含するWVSとPEWという2つの調査から得られた情報を用いて,これらのモデルの有効性を評価する。
その結果、偏見は単言語モデルと多言語モデルの両方に存在することが示され、それらは通常、多様な文化の道徳的複雑さを正確に捉えるには不十分である。
論文 参考訳(メタデータ) (2024-12-01T20:20:35Z) - See It from My Perspective: How Language Affects Cultural Bias in Image Understanding [60.70852566256668]
視覚言語モデル(VLM)は、多くの言語における画像に関するクエリに応答することができる。
画像理解におけるVLMの西洋的偏見を特徴付け,この格差の中で言語が果たす役割について検討する。
論文 参考訳(メタデータ) (2024-06-17T15:49:51Z) - Understanding the Capabilities and Limitations of Large Language Models for Cultural Commonsense [98.09670425244462]
大規模言語モデル(LLM)は、かなりの常識的理解を示している。
本稿では,文化的コモンセンスタスクの文脈におけるいくつかの最先端LCMの能力と限界について検討する。
論文 参考訳(メタデータ) (2024-05-07T20:28:34Z) - Disentangling Perceptions of Offensiveness: Cultural and Moral
Correlates [4.857640117519813]
我々は、文化的・心理的要因が攻撃性の認知的処理において重要な役割を担っていると論じる。
攻撃性に対する認識の文化的相違が顕著である。
個人の道徳的価値観は、これらのバリエーションを形成する上で重要な役割を担っている。
論文 参考訳(メタデータ) (2023-12-11T22:12:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。