論文の概要: LLMs as Cultural Archives: Cultural Commonsense Knowledge Graph Extraction
- arxiv url: http://arxiv.org/abs/2601.17971v1
- Date: Sun, 25 Jan 2026 20:05:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.565615
- Title: LLMs as Cultural Archives: Cultural Commonsense Knowledge Graph Extraction
- Title(参考訳): 文化資料としてのLLM:文化コモンセンス知識グラフ抽出
- Authors: Junior Cedric Tonga, Chen Cecilia Liu, Iryna Gurevych, Fajri Koto,
- Abstract要約: 大規模言語モデル(LLM)は、多様なWebスケールデータから学んだ豊富な文化的知識を符号化する。
文化常識知識グラフ(CCKG)構築のための反復的,即時的枠組みを提案する。
対象文化が英語ではない場合でも、文化知識グラフは英語でよりよく認識されている。
- 参考スコア(独自算出の注目度): 57.23766971626989
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) encode rich cultural knowledge learned from diverse web-scale data, offering an unprecedented opportunity to model cultural commonsense at scale. Yet this knowledge remains mostly implicit and unstructured, limiting its interpretability and use. We present an iterative, prompt-based framework for constructing a Cultural Commonsense Knowledge Graph (CCKG) that treats LLMs as cultural archives, systematically eliciting culture-specific entities, relations, and practices and composing them into multi-step inferential chains across languages. We evaluate CCKG on five countries with human judgments of cultural relevance, correctness, and path coherence. We find that the cultural knowledge graphs are better realized in English, even when the target culture is non-English (e.g., Chinese, Indonesian, Arabic), indicating uneven cultural encoding in current LLMs. Augmenting smaller LLMs with CCKG improves performance on cultural reasoning and story generation, with the largest gains from English chains. Our results show both the promise and limits of LLMs as cultural technologies and that chain-structured cultural knowledge is a practical substrate for culturally grounded NLP.
- Abstract(参考訳): 大規模言語モデル(LLM)は、多様なWebスケールデータから学んだ豊富な文化的知識を符号化し、大規模に文化的常識をモデル化する前例のない機会を提供する。
しかし、この知識は暗黙的かつ非構造的であり、解釈可能性と使用を制限している。
本稿では,LLMを文化的アーカイブとして扱う文化常識知識グラフ(CCKG)を構築するための,反復的かつ迅速なフレームワークを提案する。
文化的関連性,正確性,経路コヒーレンスを判定した5カ国でCCKGを評価した。
対象文化が非英語(例えば、中国語、インドネシア語、アラビア語)であっても、文化知識グラフは英語でよりよく認識され、現在のLLMにおける文化的エンコーディングの不均一を示す。
より小さなLCMをCCKGで強化することで、文化的な推論やストーリー生成のパフォーマンスが向上し、イングランドのチェーンから最大の利益を得ている。
以上の結果から,文化技術としてのLLMの約束と限界と,鎖構造的文化知識が文化的基盤を持つNLPの実践的基盤であることが示唆された。
関連論文リスト
- CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.653830744706305]
CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。
文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。
実験結果から,文化的理解を効果的に評価できることが示唆された。
論文 参考訳(メタデータ) (2025-09-19T17:47:48Z) - Entangled in Representations: Mechanistic Investigation of Cultural Biases in Large Language Models [42.367959511140036]
本稿では,大規模言語モデルの内部表現を探索する最初の解釈可能性に基づく手法であるCulturescopeを提案する。
本研究は,本質的な文化的偏見の尺度として,文化的平坦化スコアを導入する。
実験の結果,LLMは文化知識空間における西洋支配バイアスと文化的フラット化をエンコードしていることが明らかとなった。
論文 参考訳(メタデータ) (2025-08-12T12:05:32Z) - Cultural Learning-Based Culture Adaptation of Language Models [70.1063219524999]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。
文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文 参考訳(メタデータ) (2025-04-03T18:16:26Z) - Self-Alignment: Improving Alignment of Cultural Values in LLMs via In-Context Learning [20.24633389489255]
In-context Learning(ICL)とヒューマンサーベイデータを組み合わせた簡易で安価な手法を提案する。
本手法は、英語以外のテスト言語で有用であることが証明され、文化的に多種多様な国に対応する文化的価値との整合性を向上させることができる。
論文 参考訳(メタデータ) (2024-08-29T12:18:04Z) - Translating Across Cultures: LLMs for Intralingual Cultural Adaptation [12.5954253354303]
文化適応の課題を定義し,現代LLMの性能を評価するための評価枠組みを構築した。
我々は、自動適応で起こりうる問題を解析する。
本稿は, LLMの文化的理解と, 異文化のシナリオにおける創造性について, より深い知見を提供していくことを願っている。
論文 参考訳(メタデータ) (2024-06-20T17:06:58Z) - Understanding the Capabilities and Limitations of Large Language Models for Cultural Commonsense [98.09670425244462]
大規模言語モデル(LLM)は、かなりの常識的理解を示している。
本稿では,文化的コモンセンスタスクの文脈におけるいくつかの最先端LCMの能力と限界について検討する。
論文 参考訳(メタデータ) (2024-05-07T20:28:34Z) - Does Mapo Tofu Contain Coffee? Probing LLMs for Food-related Cultural Knowledge [47.57055368312541]
FmLAMA(FmLAMA)は、食品関連の文化的事実と食実践のバリエーションに着目した多言語データセットである。
我々は,LLMを様々なアーキテクチャや構成にわたって分析し,その性能を単言語と多言語の両方で評価する。
論文 参考訳(メタデータ) (2024-04-10T08:49:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。