論文の概要: SDUs DAISY: A Benchmark for Danish Culture
- arxiv url: http://arxiv.org/abs/2601.19930v1
- Date: Sun, 11 Jan 2026 22:17:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 02:21:38.55395
- Title: SDUs DAISY: A Benchmark for Danish Culture
- Title(参考訳): SDUs DAISY:デンマーク文化のベンチマーク
- Authors: Jacob Nielsen, Stine L. Beltoft, Peter Schneider-Kamp, Lukas Galke Poech,
- Abstract要約: デンマーク文化カノン2006(Danish Culture Canon 2006)のキュレートされたトピックに基づいて,デンマーク文化の文化遺産であるデイジーを通じて,デンマーク文化の新たなベンチマークを導入する。
カルチャーカノンの各アーティファクトについて、対応するウィキペディアページを問合せし、言語モデルにランダムな質問を生成する。
これにより、各作業のサンプリング戦略が得られ、各作業の周辺質問の中心が混在する。
- 参考スコア(独自算出の注目度): 4.1327037756193095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new benchmark for Danish culture via cultural heritage, Daisy, based on the curated topics from the Danish Culture Canon 2006. For each artifact in the culture canon, we query the corresponding Wikipedia page and have a language model generate random questions. This yields a sampling strategy within each work, with a mix of central of peripheral questions for each work, not only knowledge of mainstream information, but also in-depth cornerstones defining the heritage of Danish Culture, defined by the Canon committee. Each question-answer pair is humanly approved or corrected in the final dataset consisting of 741 close-ended question answer pairs covering topics, from 1300 BC. archaeological findings, 1700 century poems and musicals pieces to contemporary pop music and Danish design and architecture.
- Abstract(参考訳): デンマーク文化カノン2006(Danish Culture Canon 2006)のキュレートされたトピックに基づいて,デンマーク文化の文化遺産であるデイジーを通じて,デンマーク文化の新たなベンチマークを導入する。
カルチャーカノンの各アーティファクトについて、対応するウィキペディアページを問合せし、言語モデルにランダムな質問を生成する。
これにより各作品のサンプリング戦略が得られ、各作品の周辺質問の中心が混ざり合っており、メインストリームの情報だけでなく、キヤノン委員会によって定義されたデンマーク文化の遺産を詳細に定義している。
各質問回答ペアは、最終データセットにおいて、紀元前1300年からトピックをカバーする741のクローズドな質問回答ペアによって人為的に承認または修正される。
考古学的発見 1700世紀の詩と音楽作品 現代ポップミュージックとデンマークのデザインと建築
関連論文リスト
- Seeing Culture: A Benchmark for Visual Reasoning and Grounding [27.53575961739132]
我々は、新しいアプローチによる文化的推論に焦点を当てたSeeing Culture Benchmark(SCB)を紹介する。
SCBベンチマークは、東南アジア7カ国の5つのカテゴリで128の文化的なアーティファクトをキャプチャする1,065のイメージで構成されている。
論文 参考訳(メタデータ) (2025-09-20T03:47:49Z) - Do LLMs Understand Wine Descriptors Across Cultures? A Benchmark for Cultural Adaptations of Wine Reviews [11.37543031092663]
我々は、中国語と英語でワインのレビューを適応させるという、新しい問題を紹介します。
専門的レビューの最初の並列コーパスをコンパイルし、8万の中国語と16万のアングロフォンレビューを含む。
我々の分析は、現在のモデルが文化的ニュアンスを捉えるのに苦労していることを示している。
論文 参考訳(メタデータ) (2025-09-16T11:10:30Z) - GlobalMood: A cross-cultural benchmark for music emotion recognition [10.490374578193773]
「GlobalMood」は59か国から1180曲をサンプリングした異文化間ベンチマークデータセットである。
文化的に特定の音楽関連感情用語を抽出するためのボトムアップ・参加者主導のアプローチを実装した。
論文 参考訳(メタデータ) (2025-05-14T16:32:45Z) - CaLMQA: Exploring culturally specific long-form question answering across 23 languages [58.18984409715615]
CaLMQAは、文化的に異なる23言語にわたる51.7Kの質問のデータセットである。
我々は,LLM生成長文回答の事実性,関連性,表面品質を評価する。
論文 参考訳(メタデータ) (2024-06-25T17:45:26Z) - Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文 参考訳(メタデータ) (2024-06-17T14:03:27Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。