Fugu-MT 論文翻訳(概要): Large language models perceive cities through a culturally uneven baseline

論文の概要: Large language models perceive cities through a culturally uneven baseline

arxiv url: http://arxiv.org/abs/2604.20048v1
Date: Tue, 21 Apr 2026 23:05:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-23 15:36:10.884072
Title: Large language models perceive cities through a culturally uneven baseline
Title（参考訳）: 大言語モデルは文化的に不均一なベースラインを通じて都市を知覚する
Authors: Rong Zhao, Wanqi Liu, Zhizhou Sha, Nanxi Su, Yecheng Zhang,
Abstract要約: 我々は,大都市における都市認識をグローバルな街路ビューサンプルを用いて検証し,中立性を維持するか,異なる地域文化的な視点で呼び出すかのどちらかを示唆する。オープンエンドな記述と構造化された場所判断の範囲で、中立状態は実際には中立ではないことが証明された。ヨーロッパや北アメリカと結びついたプロンプトは、多くの非西洋のプロンプトよりも体系的にベースラインに近かった。
参考スコア（独自算出の注目度）: 5.705725225868815
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) are increasingly used to describe, evaluate and interpret places, yet it remains unclear whether they do so from a culturally neutral standpoint. Here we test urban perception in frontier LLMs using a balanced global street-view sample and prompts that either remain neutral or invoke different regional cultural standpoints. Across open-ended descriptions and structured place judgments, the neutral condition proved not to be neutral in practice. Prompts associated with Europe and Northern America remained systematically closer to the baseline than many non-Western prompts, indicating that model perception is organized around a culturally uneven reference frame rather than a universal one. Cultural prompting also shifted affective evaluation, producing sentiment-based ingroup preference for some prompted identities. Comparisons with regional human text-image benchmarks showed that culturally proximate prompting could improve alignment with human descriptions, but it did not recover human levels of semantic diversity and often preserved an affectively elevated style. The same asymmetry reappeared in structured judgments of safety, beauty, wealth, liveliness, boredom and depression, where model outputs were interpretable but only partly reproduced human group differences. These findings suggest that LLMs do not simply perceive cities from nowhere: they do so through a culturally uneven baseline that shapes what appears ordinary, familiar and positively valued.
Abstract（参考訳）: 大規模言語モデル(LLM)は、場所を記述、評価、解釈するためにますます使われているが、文化的に中立的な観点からそれらがそれを行うかどうかは不明である。ここでは、グローバルな街路ビューサンプルを用いて、フロンティアのLLMにおける都市認識を検証し、中立性を維持するか、異なる地域文化的な視点で呼び起こすよう促す。オープンエンドな記述と構造化された場所判断の範囲で、中立状態は実際には中立ではないことが証明された。ヨーロッパと北アメリカに関連付けられたプロンプトは、多くの非西洋のプロンプトよりも体系的にベースラインに近づき、モデル知覚は普遍的ではなく文化的に不均一な参照フレームの周りに組織されていることを示唆している。文化的な衝動も感情的評価をシフトさせ、感情に基づく内集団的嗜好を生み出した。地域人のテキスト画像のベンチマークと比較すると、文化的に親密なプロンプトは人間の記述との整合性を改善するが、人間の意味的多様性は回復せず、しばしば感情的に高められたスタイルを保った。同じ非対称性は、安全性、美しさ、富、活力、退屈、抑うつといった構造的判断において再び現れ、モデル出力は解釈可能であるが、部分的に再現された人間のグループ差しかなかった。これらの結果は、LLMが単に都市をどこからともなく知覚するわけではないことを示唆している。

関連論文リスト

Cultural Counterfactuals: Evaluating Cultural Biases in Large Vision-Language Models with Counterfactual Examples [13.476728526770023]
文化バイアスを測定する上で重要な課題は、個人が属するグループを決定することは、しばしば画像の文化的文脈に依存することである。本稿では,宗教,国籍,社会経済的地位に関連する文化的バイアスを測定するために,60k近い反事実画像を含む高品質な合成データセットについて紹介する。
論文参考訳（メタデータ） (2026-03-02T20:19:53Z)
Tears or Cheers? Benchmarking LLMs via Culturally Elicited Distinct Affective Responses [28.3173238194554]
CEDARは、文化的にアンダーラインのscElicited underlinetextscDistinct underlinetextscAffective underlinetextscResponsesをキャプチャするシナリオから構築されたベンチマークである。その結果得られたベンチマークは、7つの言語に10,962のインスタンスと14のきめ細かい感情カテゴリで構成され、各言語には400のマルチモーダルと1,166のテキストのみのサンプルが含まれている。
論文参考訳（メタデータ） (2026-01-19T13:04:26Z)
CURE: Cultural Understanding and Reasoning Evaluation - A Framework for "Thick" Culture Alignment Evaluation in LLMs [24.598338950728234]
大規模言語モデル(LLM)は、文化的に多様な環境にますます展開されている。既存の方法は、非文脈的正当性や強制選択判断に重点を置いている。現実的な状況下でモデルを提示するベンチマークのセットを紹介する。
論文参考訳（メタデータ） (2025-11-15T03:39:13Z)
LLMs and Cultural Values: the Impact of Prompt Language and Explicit Cultural Framing [0.21485350418225244]
大規模言語モデル(LLM)は、世界中のユーザによって急速に採用され、さまざまな言語でそれらと対話している。言語と文化のフレーミングが、異なる国の人的価値にどのように影響するかを検討する。
論文参考訳（メタデータ） (2025-11-06T02:09:29Z)
I Am Aligned, But With Whom? MENA Values Benchmark for Evaluating Cultural Alignment and Multilingual Bias in LLMs [5.060243371992739]
大規模言語モデル(LLM)の文化的アライメントと多言語バイアスを評価するための新しいベンチマークであるMENAValuesを紹介する。大規模で権威ある人的調査から、我々は16カ国の人口レベルの応答分布を持つMENAの社会文化的景観を捉えた構造化データセットをキュレートした。分析の結果,同じ質問が言語に基づいて大きく異なる反応をもたらす「クロス・Lingual Value Shifts」,その理由の説明を促す「Reasoning-induced Degradation」,モデルがセンシティブな質問を拒否する「Logit Leakage」,内部確率が強く隠蔽される「Logit Leakage」の3つの重要な現象が明らかになった。
論文参考訳（メタデータ） (2025-10-15T05:10:57Z)
Cross-Cultural Transfer of Commonsense Reasoning in LLMs: Evidence from the Arab World [68.19795061447044]
本稿では,アラブ世界におけるコモンセンス推論の異文化間移動について検討する。アラブ13カ国を対象とした文化基盤のコモンセンス推論データセットを用いて,軽量アライメント手法の評価を行った。以上の結果から,他国の文化特有例は12例に過ぎず,他国の文化特有例を平均10%向上させることができた。
論文参考訳（メタデータ） (2025-09-23T17:24:14Z)
CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation [61.130639734982395]
本稿では,画像の文化的関連度を評価する新しい評価指標であるCAIReを紹介する。本フレームワークは,イメージ内の実体と概念を知識ベースに基盤として,実情報を用いて各文化ラベルに対して独立した評価を行う。
論文参考訳（メタデータ） (2025-06-10T17:16:23Z)
See It from My Perspective: How Language Affects Cultural Bias in Image Understanding [60.70852566256668]
視覚言語モデル(VLM)は、多くの言語における画像に関するクエリに応答することができる。画像理解におけるVLMの西洋的偏見を特徴付け,この格差の中で言語が果たす役割について検討する。
論文参考訳（メタデータ） (2024-06-17T15:49:51Z)
Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。 LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文参考訳（メタデータ） (2023-10-19T05:38:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。