論文の概要: Culture in Action: Evaluating Text-to-Image Models through Social Activities
- arxiv url: http://arxiv.org/abs/2511.05681v1
- Date: Fri, 07 Nov 2025 19:51:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.527781
- Title: Culture in Action: Evaluating Text-to-Image Models through Social Activities
- Title(参考訳): 行動の文化:社会的活動によるテキスト・イメージ・モデルの評価
- Authors: Sina Malakouti, Boqing Gong, Adriana Kovashka,
- Abstract要約: テキスト・トゥ・イメージ(T2I)モデルは大規模なWebデータをトレーニングすることで印象的なフォトリアリズムを実現するが、モデルは文化的偏見を継承し、表現不足の地域を忠実に描写することができない。
本稿では,T2Iモデルの評価ベンチマークであるCULTIVateを紹介する。
文化的アライメント,幻覚,誇張された要素,多様性を測定するための4つの指標を提案する。
- 参考スコア(独自算出の注目度): 40.874302288116304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-image (T2I) diffusion models achieve impressive photorealism by training on large-scale web data, but models inherit cultural biases and fail to depict underrepresented regions faithfully. Existing cultural benchmarks focus mainly on object-centric categories (e.g., food, attire, and architecture), overlooking the social and daily activities that more clearly reflect cultural norms. Few metrics exist for measuring cultural faithfulness. We introduce CULTIVate, a benchmark for evaluating T2I models on cross-cultural activities (e.g., greetings, dining, games, traditional dances, and cultural celebrations). CULTIVate spans 16 countries with 576 prompts and more than 19,000 images, and provides an explainable descriptor-based evaluation framework across multiple cultural dimensions, including background, attire, objects, and interactions. We propose four metrics to measure cultural alignment, hallucination, exaggerated elements, and diversity. Our findings reveal systematic disparities: models perform better for global north countries than for the global south, with distinct failure modes across T2I systems. Human studies confirm that our metrics correlate more strongly with human judgments than existing text-image metrics.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)拡散モデルでは,大規模なWebデータをトレーニングすることで,印象的なフォトリアリズムを実現する。
既存の文化ベンチマークは、主に対象中心のカテゴリー(例えば、食べ物、服装、建築)に焦点を当てており、文化的規範をより明確に反映する社会的および日常的な活動を見下ろしている。
文化的忠実度を測定する指標は少ない。
CULTIVateは、異文化間活動(例えば、挨拶、食事、ゲーム、伝統舞踊、文化祝祭)のT2Iモデルを評価するためのベンチマークである。
CULTIVateは16か国にまたがり、576のプロンプトと19,000以上の画像を持ち、背景、服装、オブジェクト、インタラクションなど、さまざまな文化的側面にわたる説明可能な記述子ベースの評価フレームワークを提供する。
文化的アライメント,幻覚,誇張された要素,多様性を測定するための4つの指標を提案する。
モデルでは,T2Iシステム間で異なる障害モードを持つグローバルな南方よりも,グローバルな北欧諸国の方が優れた性能を示した。
人間の研究は、既存のテキスト画像のメトリクスよりも、我々のメトリクスが人間の判断と強く相関していることを確認します。
関連論文リスト
- CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation [61.130639734982395]
本稿では,画像の文化的関連度を評価する新しい評価指標であるCAIReを紹介する。
本フレームワークは,イメージ内の実体と概念を知識ベースに基盤として,実情報を用いて各文化ラベルに対して独立した評価を行う。
論文 参考訳(メタデータ) (2025-06-10T17:16:23Z) - Diffusion Models Through a Global Lens: Are They Culturally Inclusive? [15.991121392458748]
我々はCultDiffベンチマークを導入し、最先端の拡散モデルを評価する。
これらのモデルは、建築、衣服、食品の文化的なアーティファクトを生成するのに失敗することが多いことを示します。
我々は、カルトディフ-Sというニューラルネットワークによる画像画像類似度測定法を開発し、文化的アーティファクトを用いた実画像と生成画像の人間の判断を予測する。
論文 参考訳(メタデータ) (2025-02-13T03:05:42Z) - Beyond Aesthetics: Cultural Competence in Text-to-Image Models [34.98692829036475]
CUBEは、テキスト・ツー・イメージ・モデルの文化的能力を評価するための最初のベンチマークである。
CUBEは、異なる地理的文化圏の8か国に関連する文化的アーティファクトをカバーしている。
CUBE-CSpaceは、文化的多様性を評価する基盤となる文化的アーティファクトのより大きなデータセットである。
論文 参考訳(メタデータ) (2024-07-09T13:50:43Z) - CulturePark: Boosting Cross-cultural Understanding in Large Language Models [63.452948673344395]
本稿では,LLMを利用した文化データ収集のためのマルチエージェント通信フレームワークであるCultureParkを紹介する。
人間の信念、規範、習慣をカプセル化した高品質な異文化対話を生成する。
我々はこれらのモデルを,コンテンツモデレーション,文化的アライメント,文化教育という3つの下流課題にまたがって評価する。
論文 参考訳(メタデータ) (2024-05-24T01:49:02Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z) - On the Cultural Gap in Text-to-Image Generation [75.69755281031951]
テキスト・トゥ・イメージ(T2I)生成における課題のひとつは、トレーニングデータに存在する文化ギャップの意図しない反映である。
クロスカルチャー画像を生成するT2Iモデルの能力を体系的に評価するベンチマークは存在しない。
本稿では,モデルが対象文化にどの程度適しているかを評価するため,包括的評価基準付きChallenging Cross-Cultural (C3)ベンチマークを提案する。
論文 参考訳(メタデータ) (2023-07-06T13:17:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。