Fugu-MT 論文翻訳(概要): SDUs DAISY: A Benchmark for Danish Culture

論文の概要: SDUs DAISY: A Benchmark for Danish Culture

arxiv url: http://arxiv.org/abs/2601.19930v1
Date: Sun, 11 Jan 2026 22:17:34 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-02 02:21:38.55395
Title: SDUs DAISY: A Benchmark for Danish Culture
Title（参考訳）: SDUs DAISY:デンマーク文化のベンチマーク
Authors: Jacob Nielsen, Stine L. Beltoft, Peter Schneider-Kamp, Lukas Galke Poech,
Abstract要約: デンマーク文化カノン2006(Danish Culture Canon 2006)のキュレートされたトピックに基づいて,デンマーク文化の文化遺産であるデイジーを通じて,デンマーク文化の新たなベンチマークを導入する。カルチャーカノンの各アーティファクトについて、対応するウィキペディアページを問合せし、言語モデルにランダムな質問を生成する。これにより、各作業のサンプリング戦略が得られ、各作業の周辺質問の中心が混在する。
参考スコア（独自算出の注目度）: 4.1327037756193095
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce a new benchmark for Danish culture via cultural heritage, Daisy, based on the curated topics from the Danish Culture Canon 2006. For each artifact in the culture canon, we query the corresponding Wikipedia page and have a language model generate random questions. This yields a sampling strategy within each work, with a mix of central of peripheral questions for each work, not only knowledge of mainstream information, but also in-depth cornerstones defining the heritage of Danish Culture, defined by the Canon committee. Each question-answer pair is humanly approved or corrected in the final dataset consisting of 741 close-ended question answer pairs covering topics, from 1300 BC. archaeological findings, 1700 century poems and musicals pieces to contemporary pop music and Danish design and architecture.
Abstract（参考訳）: デンマーク文化カノン2006(Danish Culture Canon 2006)のキュレートされたトピックに基づいて,デンマーク文化の文化遺産であるデイジーを通じて,デンマーク文化の新たなベンチマークを導入する。カルチャーカノンの各アーティファクトについて、対応するウィキペディアページを問合せし、言語モデルにランダムな質問を生成する。これにより各作品のサンプリング戦略が得られ、各作品の周辺質問の中心が混ざり合っており、メインストリームの情報だけでなく、キヤノン委員会によって定義されたデンマーク文化の遺産を詳細に定義している。各質問回答ペアは、最終データセットにおいて、紀元前1300年からトピックをカバーする741のクローズドな質問回答ペアによって人為的に承認または修正される。考古学的発見 1700世紀の詩と音楽作品現代ポップミュージックとデンマークのデザインと建築

関連論文リスト

Seeing Culture: A Benchmark for Visual Reasoning and Grounding [27.53575961739132]
我々は、新しいアプローチによる文化的推論に焦点を当てたSeeing Culture Benchmark(SCB)を紹介する。 SCBベンチマークは、東南アジア7カ国の5つのカテゴリで128の文化的なアーティファクトをキャプチャする1,065のイメージで構成されている。
論文参考訳（メタデータ） (2025-09-20T03:47:49Z)
Do LLMs Understand Wine Descriptors Across Cultures? A Benchmark for Cultural Adaptations of Wine Reviews [11.37543031092663]
我々は、中国語と英語でワインのレビューを適応させるという、新しい問題を紹介します。専門的レビューの最初の並列コーパスをコンパイルし、8万の中国語と16万のアングロフォンレビューを含む。我々の分析は、現在のモデルが文化的ニュアンスを捉えるのに苦労していることを示している。
論文参考訳（メタデータ） (2025-09-16T11:10:30Z)
GlobalMood: A cross-cultural benchmark for music emotion recognition [10.490374578193773]
「GlobalMood」は59か国から1180曲をサンプリングした異文化間ベンチマークデータセットである。文化的に特定の音楽関連感情用語を抽出するためのボトムアップ・参加者主導のアプローチを実装した。
論文参考訳（メタデータ） (2025-05-14T16:32:45Z)
Diffusion Models Through a Global Lens: Are They Culturally Inclusive? [15.991121392458748]
我々はCultDiffベンチマークを導入し、最先端の拡散モデルを評価する。これらのモデルは、建築、衣服、食品の文化的なアーティファクトを生成するのに失敗することが多いことを示します。我々は、カルトディフ-Sというニューラルネットワークによる画像画像類似度測定法を開発し、文化的アーティファクトを用いた実画像と生成画像の人間の判断を予測する。
論文参考訳（メタデータ） (2025-02-13T03:05:42Z)
CulturalBench: A Robust, Diverse, and Challenging Cultural Benchmark by Human-AI CulturalTeaming [75.82306181299153]
カルチャーベンチ(CulturalBench)は、LMの文化的知識を評価するための1,696の人文・人文的な質問である。バングラデシュ、ジンバブエ、ペルーなど45の地域をカバーしている。我々はHuman-AI Red-Teamingにインスパイアされた手法を用いてCulturalBenchを構築した。
論文参考訳（メタデータ） (2024-10-03T17:04:31Z)
CaLMQA: Exploring culturally specific long-form question answering across 23 languages [58.18984409715615]
CaLMQAは、文化的に異なる23言語にわたる51.7Kの質問のデータセットである。我々は,LLM生成長文回答の事実性,関連性,表面品質を評価する。
論文参考訳（メタデータ） (2024-06-25T17:45:26Z)
Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文参考訳（メタデータ） (2024-06-17T14:03:27Z)
CULTURE-GEN: Revealing Global Cultural Perception in Language Models through Natural Language Prompting [73.94059188347582]
110か国・地域での3つのSOTAモデルの文化認識を,文化条件付き世代を通して8つの文化関連トピックについて明らかにした。文化条件付き世代は、デフォルトの文化と区別される余分な文化を区別する言語的な「マーカー」から成り立っていることが判明した。
論文参考訳（メタデータ） (2024-04-16T00:50:43Z)
Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文参考訳（メタデータ） (2024-02-14T18:16:54Z)
A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文参考訳（メタデータ） (2022-11-21T14:15:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。