論文の概要: Global Patterns of Knowledge: Language, Genre, and the Geography of Knowledge
- arxiv url: http://arxiv.org/abs/2507.22271v1
- Date: Tue, 29 Jul 2025 22:43:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:17.897358
- Title: Global Patterns of Knowledge: Language, Genre, and the Geography of Knowledge
- Title(参考訳): 知識のグローバルなパターン:言語、ジェンダー、知識の地理学
- Authors: Akira Matsui, Fujio Toriumi, Mitsuo Yoshida, Taichi Murayama, Shiori Hironaka,
- Abstract要約: 我々は、ウィキペディアプラットフォームの編集履歴を理解するために、経済的な複雑さ分析を利用する。
我々は、異なる言語コミュニティが、特に文化的主題において、異なる専門性を示すことを明らかにした。
本研究は, 科学などの標準化トピックに共通する知識生産形態が存在するが, 文化的トピックや陰謀論などの議論の的となっているテーマには, より多様であることを示す。
- 参考スコア(独自算出の注目度): 0.45666156207236525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online platforms, particularly Wikipedia, have become critical infrastructures for providing diverse linguistic and cultural contexts. This human-curated knowledge now forms the foundation for modern AI. However, we have not yet fully explored how knowledge production capability vary across languages and domains. Here, we address this gap by applying economic complexity analysis to understand the editing history of Wikipedia platforms. This approach allows us to infer the latent mode of ``knowledge-production'' of each language community from the diversity and specialization of its contributed content. We reveal that different language communities exhibit distinct specializations, particularly in cultural subjects. Furthermore, we map the global landscape of these production modes, finding that the structure of knowledge production strongly reflects geopolitical boundaries. Our findings suggest that while a common mode of knowledge production exists for standardized topics such as science, it is more diverse for cultural topics or controversial subjects such as conspiracy theories. The association between differences in knowledge production capability and geopolitical factors implies how linguistic and cultural dynamics shape our worldview and the biases embedded in Wikipedia data, a unique, massive, and essential dataset for modern AI.
- Abstract(参考訳): オンラインプラットフォーム、特にウィキペディアは、多様な言語的・文化的文脈を提供するための重要な基盤となっている。
この人為的な知識は、現代AIの基礎となっている。
しかし、言語やドメインによって知識生産能力がどのように異なるか、まだ完全には検討していません。
ここでは、ウィキペディアプラットフォームの編集履歴を理解するために、経済的な複雑性分析を適用することで、このギャップに対処する。
このアプローチにより、貢献するコンテンツの多様性と特殊化から、各言語コミュニティの「知識生産」の潜伏モードを推測することができる。
我々は、異なる言語コミュニティが、特に文化的主題において、異なる専門性を示すことを明らかにした。
さらに,これらの生産形態のグローバルな景観を地図化し,知識生産の構造が地政学的境界を強く反映していることを見出した。
本研究は, 科学などの標準化トピックに共通する知識生産形態が存在するが, 文化的トピックや陰謀論などの議論の的となっているテーマには, より多様であることが示唆された。
知識生産能力の違いと地政学的要因の関連性は、言語と文化のダイナミクスがわれわれの世界観とウィキペディアのデータに埋め込まれたバイアスをどのように形作るかを示している。
関連論文リスト
- A Community-driven vision for a new Knowledge Resource for AI [59.29703403953085]
WordNetのような知識リソースの成功にもかかわらず、検証可能な汎用的な知識ソースは、AIインフラストラクチャにおいて重要な欠陥である。
本稿では,この知見を要約し,新しい知識基盤に向けたコミュニティ主導のビジョンを概説する。
論文 参考訳(メタデータ) (2025-06-19T20:51:28Z) - MAKIEval: A Multilingual Automatic WiKidata-based Framework for Cultural Awareness Evaluation for LLMs [26.806566827956875]
MAKIEvalは、大規模言語モデルにおける文化的認識を評価するための自動多言語フレームワークである。
モデル出力における文化的実体を自動的に識別し、構造化された知識にリンクする。
オープンソースのシステムとプロプライエタリシステムの両方を対象とする,世界のさまざまな場所で開発された7つのLLMを評価した。
論文 参考訳(メタデータ) (2025-05-27T19:29:40Z) - Language Specific Knowledge: Do Models Know Better in X than in English? [9.923619418000488]
コードスイッチングは、異なる言語間で同じ発話、思考、会話を交互に行う一般的な現象である。
我々はこの現象を表すために言語特化知識(LSK)という用語を作った。
英語以外の言語でチェーン・オブ・シークレット・推論を用いることで,言語モデルの性能が向上することがわかった。
論文 参考訳(メタデータ) (2025-05-21T00:31:13Z) - Risks of Cultural Erasure in Large Language Models [4.613949381428196]
我々は,歴史的権力不平等を疑問視し,考慮する言語技術の量化可能な評価の必要性を論じる。
我々は、言語モデルがこれらの文脈を記述するよう依頼されたとき、世界中の様々な場所で生成する表現を探索する。
言語モデルアプリケーションを用いて,旅行レコメンデーションに表される文化を分析した。
論文 参考訳(メタデータ) (2025-01-02T04:57:50Z) - Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文 参考訳(メタデータ) (2024-06-17T14:03:27Z) - Elements of World Knowledge (EWoK): A Cognition-Inspired Framework for Evaluating Basic World Knowledge in Language Models [51.891804790725686]
要素・オブ・ワールド・ナレッジ(Elements of World Knowledge, EWoK)は、言語モデルによる世界モデリングの基礎となる概念的知識の理解を評価するためのフレームワークである。
EWoK-core-1.0は世界11の知識領域をカバーする4,374項目のデータセットである。
すべてのテストされたモデルは人間よりもパフォーマンスが悪く、その結果はドメインによって大きく異なる。
論文 参考訳(メタデータ) (2024-05-15T17:19:42Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。