論文の概要: CultureBank: An Online Community-Driven Knowledge Base Towards Culturally Aware Language Technologies
- arxiv url: http://arxiv.org/abs/2404.15238v1
- Date: Tue, 23 Apr 2024 17:16:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 13:12:44.791868
- Title: CultureBank: An Online Community-Driven Knowledge Base Towards Culturally Aware Language Technologies
- Title(参考訳): CultureBank: 文化的に認識可能な言語技術を目指す,オンラインコミュニティ駆動の知識ベース
- Authors: Weiyan Shi, Ryan Li, Yutong Zhang, Caleb Ziems, Chunhua yu, Raya Horesh, Rogério Abreu de Paula, Diyi Yang,
- Abstract要約: CultureBankは、ユーザの自己物語に基づいて構築された知識ベースである。
TikTokから12K、Redditから1Kの文化的記述が含まれている。
今後の文化的に意識された言語技術に対する推奨事項を提示する。
- 参考スコア(独自算出の注目度): 53.2331634010413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To enhance language models' cultural awareness, we design a generalizable pipeline to construct cultural knowledge bases from different online communities on a massive scale. With the pipeline, we construct CultureBank, a knowledge base built upon users' self-narratives with 12K cultural descriptors sourced from TikTok and 11K from Reddit. Unlike previous cultural knowledge resources, CultureBank contains diverse views on cultural descriptors to allow flexible interpretation of cultural knowledge, and contextualized cultural scenarios to help grounded evaluation. With CultureBank, we evaluate different LLMs' cultural awareness, and identify areas for improvement. We also fine-tune a language model on CultureBank: experiments show that it achieves better performances on two downstream cultural tasks in a zero-shot setting. Finally, we offer recommendations based on our findings for future culturally aware language technologies. The project page is https://culturebank.github.io . The code and model is at https://github.com/SALT-NLP/CultureBank . The released CultureBank dataset is at https://huggingface.co/datasets/SALT-NLP/CultureBank .
- Abstract(参考訳): 言語モデルの文化的意識を高めるため,我々は,異なるオンラインコミュニティの文化的知識基盤を大規模に構築するための一般化可能なパイプラインを設計する。
このパイプラインでは、TikTokから12Kの文化記述子とRedditから1Kの文化記述子を使って、ユーザの自己物語に基づいて構築された知識ベースであるCultureBankを構築します。
従来の文化知識資源とは異なり、カルチャーバンクは文化的知識の柔軟な解釈を可能にする文化記述子についての多様な見解と、文脈化された文化的シナリオが評価の基礎となる。
CultureBankでは、異なるLLMの文化的意識を評価し、改善すべき領域を特定します。
実験では、ゼロショット設定で、下流の2つの文化的タスクのパフォーマンスが向上していることが示されています。
最後に,今後の文化に配慮した言語技術に対する知見に基づくレコメンデーションを提案する。
プロジェクトページはhttps://culturebank.github.io である。
コードとモデルはhttps://github.com/SALT-NLP/CultureBankにある。
CultureBankのデータセットはhttps://huggingface.co/datasets/SALT-NLP/CultureBankにある。
関連論文リスト
- Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z) - Cultural Compass: Predicting Transfer Learning Success in Offensive
Language Detection with Cultural Features [21.54368550883955]
本研究は,文化的特徴の交わりと伝達学習の有効性について考察する。
これらの結果に基づいて,文化情報のデータセットへの統合を提唱する。
我々の研究は、より包括的で文化的に敏感な言語技術の探求において、一歩前進していることを示している。
論文 参考訳(メタデータ) (2023-10-10T09:29:38Z) - Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of
Text-To-Image Models [36.04866429768613]
本稿では,3つの階層(文化次元,文化領域,文化概念)にまたがる文化を特徴付けることによって,テキスト・トゥ・イメージ・モデルに埋め込まれた文化的知覚を探求する。
本稿では,CLIP空間を用いた内在的評価,ビジュアルクエスト・アンサー(VQA)モデルによる外在的評価,人的評価など,総合的な評価手法を提案する。
我々の実験は、TTIモデルにおける文化的エンコーディングの性質について、Do、What、What、Howおよび研究に関する洞察を提供し、異文化的な応用への道を開いた。
論文 参考訳(メタデータ) (2023-10-03T10:13:36Z) - Cultural Alignment in Large Language Models: An Explanatory Analysis
Based on Hofstede's Cultural Dimensions [11.17369336069962]
提案された文化的アライメントテスト(CAT)は、ホフステデの文化的次元の枠組みを用いて文化的アライメントを定量化する。
我々は、各国の多様な文化にまたがる最先端の大規模言語モデル(LLM)に埋め込まれた文化的価値を評価するために、我々のアプローチを適用した。
論文 参考訳(メタデータ) (2023-08-25T14:50:13Z) - Benchmarking LLM-based Machine Translation on Cultural Awareness [53.83912076814508]
文化的内容の翻訳は、効果的な異文化間コミュニケーションに不可欠である。
インコンテキスト学習の最近の進歩は、機械翻訳タスクにおける大規模言語モデル(LLM)のガイドに軽量なプロンプトを利用する。
我々は、文化的に関連する並列コーパスを構築するために、新しいデータキュレーションパイプラインを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:56:33Z) - Assessing Cross-Cultural Alignment between ChatGPT and Human Societies:
An Empirical Study [9.919972416590124]
ChatGPTは、対話で人間のような反応を生成できるという異常な能力で広く認知されている。
そこで我々は,ChatGPTの文化的背景を,人間の文化的差異を定量化するための質問に対する応答の分析によって検討した。
論文 参考訳(メタデータ) (2023-03-30T15:43:39Z) - Measuring Commonality in Recommendation of Cultural Content: Recommender
Systems to Enhance Cultural Citizenship [67.5613995938273]
そこで本稿では,文化内容の特定のカテゴリにおいて,特定のユーザ集団に親しみのあるレコメンデーションの度合いを反映した新しい尺度として,共通性を導入する。
以上の結果から,共通性は既存の指標と相補的なシステム行動の特性を捉え,利用者の文化的市民性を高めることを目的としたリコメンデータシステムにおける代替的非個人化介入の必要性が示唆された。
論文 参考訳(メタデータ) (2022-08-02T19:14:49Z) - Learning Robust Real-Time Cultural Transmission without Human Data [82.05222093231566]
人工知能エージェントにおけるゼロショット、高リコール文化伝達を生成する方法を提案する。
我々のエージェントは、事前に収集された人間のデータを使わずに、新しい文脈で人間からリアルタイムの文化的伝達に成功した。
これは、人工知能を開発するアルゴリズムとしての文化進化の道を開くものである。
論文 参考訳(メタデータ) (2022-03-01T19:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。