論文の概要: Crossing Boundaries: Leveraging Semantic Divergences to Explore Cultural Novelty in Cooking Recipes
- arxiv url: http://arxiv.org/abs/2503.24027v1
- Date: Mon, 31 Mar 2025 12:52:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 19:35:57.391911
- Title: Crossing Boundaries: Leveraging Semantic Divergences to Explore Cultural Novelty in Cooking Recipes
- Title(参考訳): 横断境界:料理レシピにおける文化的ノベルティの探求にセマンティック・ディバージェンスを活用する
- Authors: Florian Carichon, Romain Rampa, Golnoosh Farnadi,
- Abstract要約: 社会的要因、特に文化的背景は、新規性と革新に対する認識に大きな影響を及ぼす。
文化的ノベルティは、異なるコミュニティ間の距離によって形成されたサリエンスとノベルティの相違から生じる。
本稿では,社会学と経営学の知識を統合する学際的枠組みを提案する。
- 参考スコア(独自算出の注目度): 4.276697874428501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Novelty modeling and detection is a core topic in Natural Language Processing (NLP), central to numerous tasks such as recommender systems and automatic summarization. It involves identifying pieces of text that deviate in some way from previously known information. However, novelty is also a crucial determinant of the unique perception of relevance and quality of an experience, as it rests upon each individual's understanding of the world. Social factors, particularly cultural background, profoundly influence perceptions of novelty and innovation. Cultural novelty arises from differences in salience and novelty as shaped by the distance between distinct communities. While cultural diversity has garnered increasing attention in artificial intelligence (AI), the lack of robust metrics for quantifying cultural novelty hinders a deeper understanding of these divergences. This gap limits quantifying and understanding cultural differences within computational frameworks. To address this, we propose an interdisciplinary framework that integrates knowledge from sociology and management. Central to our approach is GlobalFusion, a novel dataset comprising 500 dishes and approximately 100,000 cooking recipes capturing cultural adaptation from over 150 countries. By introducing a set of Jensen-Shannon Divergence metrics for novelty, we leverage this dataset to analyze textual divergences when recipes from one community are modified by another with a different cultural background. The results reveal significant correlations between our cultural novelty metrics and established cultural measures based on linguistic, religious, and geographical distances. Our findings highlight the potential of our framework to advance the understanding and measurement of cultural diversity in AI.
- Abstract(参考訳): ノベルティモデリングと検出は自然言語処理(NLP)の中核的なトピックであり、リコメンダシステムや自動要約などの多くのタスクの中心となっている。
それは、以前知られていた情報から何らかの方法で逸脱するテキストの断片を特定することを含む。
しかし、新奇性は、個々人の世界に対する理解に依存しているため、経験の関連性や質に関する独特の認識を決定づける重要な要因でもある。
社会的要因、特に文化的背景は、新規性と革新に対する認識に大きな影響を及ぼす。
文化的ノベルティは、異なるコミュニティ間の距離によって形成されたサリエンスとノベルティの相違から生じる。
文化の多様性が人工知能(AI)の注目を集めている一方で、文化的ノベルティを定量化するための堅牢な指標の欠如は、これらの相違点のより深い理解を妨げる。
このギャップは、計算フレームワーク内の文化的な違いを定量化し、理解することを制限する。
そこで我々は,社会学と経営学の知識を統合する学際的枠組みを提案する。
われわれのアプローチの中心は、500の料理と約10万の料理レシピからなる新しいデータセットGlobalFusionだ。
新規性のためのJensen-Shannon Divergenceメトリクスのセットを導入することで、このデータセットを利用して、あるコミュニティのレシピが別の文化的背景によって変更されたときに、テキストの相違を分析する。
その結果,文化的ノベルティ尺度と,言語的,宗教的,地理的距離に基づく文化的尺度の確立との間に有意な相関が認められた。
本研究は,AIにおける文化的多様性の理解と測定を促進する枠組みの可能性を明らかにするものである。
関連論文リスト
- CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.90288681622152]
大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。
既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。
本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文 参考訳(メタデータ) (2025-04-09T13:40:13Z) - Cultural Learning-Based Culture Adaptation of Language Models [70.1063219524999]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。
文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文 参考訳(メタデータ) (2025-04-03T18:16:26Z) - CultureVLM: Characterizing and Improving Cultural Understanding of Vision-Language Models for over 100 Countries [63.00147630084146]
視覚言語モデル(VLM)は高度な人間とAIの相互作用を持つが、文化的な理解に苦慮している。
CultureVerseは大規模なマルチモーダルベンチマークで、682の文化的概念、188の国/地域、15の文化的概念、3の質問タイプをカバーしている。
本稿では,文化理解の大幅な向上を実現するために,我々のデータセットを微調整したVLMのシリーズであるCultureVLMを提案する。
論文 参考訳(メタデータ) (2025-01-02T14:42:37Z) - How Well Do LLMs Identify Cultural Unity in Diversity? [12.982460687543952]
本稿では,概念の文化的統一性を理解するために,デコーダのみの大規模言語モデル(LLM)を評価するためのベンチマークデータセットを提案する。
CUNITは、10か国で285の伝統的な文化的概念に基づいて構築された1,425の評価例で構成されている。
高い関連性を持つ異文化のコンセプトペアを識別するLLMの能力を評価するために,コントラストマッチングタスクを設計する。
論文 参考訳(メタデータ) (2024-08-09T14:45:22Z) - Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文 参考訳(メタデータ) (2024-06-17T14:03:27Z) - Does Mapo Tofu Contain Coffee? Probing LLMs for Food-related Cultural Knowledge [47.57055368312541]
FmLAMA(FmLAMA)は、食品関連の文化的事実と食実践のバリエーションに着目した多言語データセットである。
我々は,LLMを様々なアーキテクチャや構成にわたって分析し,その性能を単言語と多言語の両方で評価する。
論文 参考訳(メタデータ) (2024-04-10T08:49:27Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Cultural Adaptation of Recipes [24.825456977440616]
本稿では、中国料理と英語料理のレシピの翻訳と文化適応に関する新たな課題を紹介する。
この調査を支援するために、中国語と英語で書かれたレシピを自動的に組み合わせたユニークなデータセットであるCulturalRecipesを提示する。
我々は,GPT-4や他の大規模言語モデル,従来の機械翻訳,情報検索技術など,様々な手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-10-26T12:39:20Z) - Benchmarking Machine Translation with Cultural Awareness [50.183458829028226]
文化関連コンテンツの翻訳は、効果的な異文化間コミュニケーションに不可欠である。
多くの文化特化項目(CSI)は言語間の翻訳を欠いていることが多い。
この難しさは機械翻訳システムの文化的意識の分析を妨げる。
論文 参考訳(メタデータ) (2023-05-23T17:56:33Z) - Deception detection in text and its relation to the cultural dimension
of individualism/collectivism [6.17866386107486]
本研究は,文化における特定の言語的特徴の活用の相違が,個性主義/選択主義の分断に関して,規範に起因しているかどうかを考察する。
我々は、音韻学、形態学、構文に基づく幅広いn-gram特徴を実験することにより、カルチャー/言語対応分類器を作成する。
我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)から11のデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-05-26T13:09:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。