Fugu-MT 論文翻訳(概要): Toward Culturally Grounded Natural Language Processing

論文の概要: Toward Culturally Grounded Natural Language Processing

arxiv url: http://arxiv.org/abs/2603.26013v1
Date: Fri, 27 Mar 2026 02:08:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-30 21:49:48.326231
Title: Toward Culturally Grounded Natural Language Processing
Title（参考訳）: 文化に根ざした自然言語処理を目指して
Authors: Sina Bagheri Nezhad,
Abstract要約: 本稿では,多言語性能の不平等,多言語間移動,文化意識評価,文化アライメント,ベンチマーク設計批判を対象とする50以上の論文を合成する。フィールドは、ベンチマークスプレッドシート内の独立した行として扱われる言語から、コミュニケーティブなエコロジーのモデリングへと移行すべきである、と我々は主張する。
参考スコア（独自算出の注目度）: 0.33842793760651557
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent progress in multilingual NLP is often taken as evidence of broader global inclusivity, but a growing literature shows that multilingual capability and cultural competence come apart. This paper synthesizes over 50 papers from 2020--2026 spanning multilingual performance inequality, cross-lingual transfer, culture-aware evaluation, cultural alignment, multimodal local-knowledge modeling, benchmark design critiques, and community-grounded data practices. Across this literature, training data coverage remains a strong determinant of performance, yet it is not sufficient: tokenization, prompt language, translated benchmark design, culturally specific supervision, and multimodal context all materially affect outcomes. Recent work on Global-MMLU, CDEval, WorldValuesBench, CulturalBench, CULEMO, CulturalVQA, GIMMICK, DRISHTIKON, WorldCuisines, CARE, CLCA, and newer critiques of benchmark design and community-grounded evaluation shows that strong multilingual models can still flatten local norms, misread culturally grounded cues, and underperform in lower-resource or community-specific settings. We argue that the field should move from treating languages as isolated rows in a benchmark spreadsheet toward modeling communicative ecologies: the institutions, scripts, translation pipelines, domains, modalities, and communities through which language is used. On that basis, we propose a research agenda for culturally grounded NLP centered on richer contextual metadata, culturally stratified evaluation, participatory alignment, within-language variation, and multimodal community-aware design.
Abstract（参考訳）: 近年の多言語NLPの進歩は,グローバルな傾向を示す証拠として捉えられることが多いが,多言語能力と文化的能力の相違が指摘されている。本稿では,2020年から2026年にかけての50以上の論文を合成し,多言語のパフォーマンス不平等,異言語間移動,文化意識評価,文化的アライメント,マルチモーダルな局所知識モデリング,ベンチマーク設計批判,地域データ実践について述べる。トークン化、プロンプト言語、翻訳されたベンチマーク設計、文化的に特定の監督、そしてマルチモーダルコンテキストが結果に重大な影響を与えている。近年のGlobal-MMLU, CDEval, WorldValuesBench, CulturalBench, CULEMO, CulturalVQA, GIMMICK, DRISHTIKON, WorldCuisines, CARE, CLCA, およびベンチマーク設計とコミュニティグラウンド評価の新たな批判は,強い多言語モデルが依然としてローカルな規範をフラット化し, 文化的に根ざしたキューを誤読し, 低リソースやコミュニティ特有の設定で過小評価されていることを示している。ベンチマークスプレッドシートでは、言語を独立した行として扱うことから、組織、スクリプト、翻訳パイプライン、ドメイン、モダリティ、言語が使われているコミュニティなど、コミュニケーション的エコロジーをモデル化すべきである。そこで我々は, より豊かな文脈メタデータ, 文化的階層化評価, 参加型アライメント, 言語内変異, マルチモーダル・コミュニティ・アウェアデザインを中心に, 文化的基盤を有するNLPの研究課題を提案する。

関連論文リスト

MMA-ASIA: A Multilingual and Multimodal Alignment Framework for Culturally-Grounded Evaluation [91.22008265721952]
MMA-ASIAは、アジア8か国と10か国を対象とする人為的、多言語的、マルチモーダルなベンチマークに重点を置いている。これは、テキスト、画像(視覚的質問応答)、音声の3つのモードにまたがる入力レベルで整列された最初のデータセットである。 i) 国間の文化的認識格差、(ii) 言語間の整合性、(iii) 言語間の整合性、(iv) 文化知識の一般化、(v) 基礎的妥当性を評価する5次元評価プロトコルを提案する。
論文参考訳（メタデータ） (2025-10-07T14:12:12Z)
CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.653830744706305]
CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。実験結果から,文化的理解を効果的に評価できることが示唆された。
論文参考訳（メタデータ） (2025-09-19T17:47:48Z)
Grounding Multilingual Multimodal LLMs With Cultural Knowledge [48.95126394270723]
本稿では,MLLMを文化的知識に根ざしたデータ中心型アプローチを提案する。 CulturalGroundは、42の国と39の言語にまたがる2200万の高品質で文化的に豊かなVQAペアで構成されている。我々は,MLLM CulturalPangeaをCulturalGround上で学習し,汎用性を維持するために,標準の多言語指導訓練データをインターリーブする。
論文参考訳（メタデータ） (2025-08-10T16:24:11Z)
MyCulture: Exploring Malaysia's Diverse Culture under Low-Resource Language Constraints [7.822567458977689]
MyCultureは、マレーシアの文化に関する大規模言語モデル(LLM)を総合的に評価するために設計されたベンチマークである。従来のベンチマークとは異なり、MyCultureは未定義のオプションなしで、新しいオープンエンドの複数選択質問フォーマットを採用している。構造化された出力と自由形式出力のモデル性能を比較して構造バイアスを解析し、多言語的プロンプト変動による言語バイアスを評価する。
論文参考訳（メタデータ） (2025-08-07T14:17:43Z)
MAKIEval: A Multilingual Automatic WiKidata-based Framework for Cultural Awareness Evaluation for LLMs [37.98920430188422]
MAKIEvalは、大規模言語モデルにおける文化的認識を評価するための自動多言語フレームワークである。モデル出力における文化的実体を自動的に識別し、構造化された知識にリンクする。オープンソースのシステムとプロプライエタリシステムの両方を対象とする,世界のさまざまな場所で開発された7つのLLMを評価した。
論文参考訳（メタデータ） (2025-05-27T19:29:40Z)
CulFiT: A Fine-grained Cultural-aware LLM Training Paradigm via Multilingual Critique Data Synthesis [41.261808170896686]
CulFiTは、多言語データと微粒な報酬モデリングを利用して、文化的感受性と傾きを高める新しいトレーニングパラダイムである。本手法は,文化関連諸質問を合成し,文化関連言語における批判データを構築し,文化文献を検証可能な知識単位に分解するために,きめ細かい報酬を用いる。
論文参考訳（メタデータ） (2025-05-26T04:08:26Z)
Cultural Learning-Based Culture Adaptation of Language Models [70.1063219524999]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文参考訳（メタデータ） (2025-04-03T18:16:26Z)
Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文参考訳（メタデータ） (2024-02-14T18:16:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。