論文の概要: EB-NeRD: A Large-Scale Dataset for News Recommendation
- arxiv url: http://arxiv.org/abs/2410.03432v1
- Date: Fri, 4 Oct 2024 13:43:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 22:19:23.266681
- Title: EB-NeRD: A Large-Scale Dataset for News Recommendation
- Title(参考訳): EB-NeRD:ニュースレコメンデーションのための大規模データセット
- Authors: Johannes Kruse, Kasper Lindskow, Saikishore Kalloori, Marco Polignano, Claudio Pomo, Abhishek Srivastava, Anshuk Uppal, Michael Riis Andersen, Jes Frellsen,
- Abstract要約: 我々はEkstra Bladet News Recommendation dataset (EB-NeRD)を紹介する。
このデータセットには、100万人以上のユーザと、Ekstra Bladetの3700万以上のインプレッションログが含まれている。
EB-NeRDはRecSys '24 Challengeのベンチマークデータセットとして機能した。
- 参考スコア(独自算出の注目度): 10.456213850107288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personalized content recommendations have been pivotal to the content experience in digital media from video streaming to social networks. However, several domain specific challenges have held back adoption of recommender systems in news publishing. To address these challenges, we introduce the Ekstra Bladet News Recommendation Dataset (EB-NeRD). The dataset encompasses data from over a million unique users and more than 37 million impression logs from Ekstra Bladet. It also includes a collection of over 125,000 Danish news articles, complete with titles, abstracts, bodies, and metadata, such as categories. EB-NeRD served as the benchmark dataset for the RecSys '24 Challenge, where it was demonstrated how the dataset can be used to address both technical and normative challenges in designing effective and responsible recommender systems for news publishing. The dataset is available at: https://recsys.eb.dk.
- Abstract(参考訳): パーソナライズされたコンテンツレコメンデーションは、ビデオストリーミングからソーシャルネットワークまで、デジタルメディアのコンテンツ体験に重要な要素となっている。
しかし、いくつかのドメイン固有の課題は、ニュース出版におけるレコメンデーターシステムの採用を妨げている。
これらの課題に対処するために、Ekstra Bladet News Recommendation Dataset (EB-NeRD)を紹介する。
このデータセットには、100万人以上のユニークユーザと、Ekstra Bladetの3700万以上のインプレッションログが含まれている。
また、125,000以上のデンマークのニュース記事のコレクションが含まれており、タイトル、要約、ボディ、カテゴリなどのメタデータが完備している。
EB-NeRDはRecSys '24 Challengeのベンチマークデータセットとして機能し、このデータセットが、ニュースパブリッシングのために効果的で責任あるレコメンデータシステムを設計する際の技術的および規範的な課題にどのように対処できるかを実証した。
データセットは以下の通りである。
関連論文リスト
- A Systematic Review of NeurIPS Dataset Management Practices [7.974245534539289]
我々はNeurIPSトラックで公開されたデータセットの体系的なレビューを行い、証明、配布、倫理的開示、ライセンスの4つの重要な側面に焦点を当てる。
この結果から, データセットの出現は不明瞭なフィルタリングやキュレーションのプロセスのため, しばしば不明瞭であることが明らかとなった。
これらの矛盾は、データセットの公開と管理のための標準化されたデータインフラストラクチャーの緊急の必要性を浮き彫りにする。
論文 参考訳(メタデータ) (2024-10-31T23:55:41Z) - SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - RecSys Challenge 2024: Balancing Accuracy and Editorial Values in News Recommendations [10.456213850107288]
RecSys Challenge 2024は、効果的で責任あるレコメンデーションシステムの設計に固有の技術的課題と規範的課題の両方に対処することで、ニュースレコメンデーションを進めることを目的としている。
本稿では,デンマークのニュース出版社 Ekstra Bladet と JP/Politikens Media Group が提供したデータセットについて述べる。
論文 参考訳(メタデータ) (2024-09-30T16:42:57Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation
of Videos [106.06278332186106]
マルチモーダル・アウトプット(MSMO)を用いたマルチモーダル・サマリゼーションが有望な研究方向として浮上している。
既存のパブリックMSMOデータセットには多くの制限がある。
textbfMMSumデータセットを精巧にキュレートした。
論文 参考訳(メタデータ) (2023-06-07T07:43:11Z) - DataFinder: Scientific Dataset Recommendation from Natural Language
Descriptions [100.52917027038369]
我々は、短い自然言語記述を与えられたデータセットを推奨するタスクを運用する。
この作業を容易にするために、我々は、より大規模な自動構築トレーニングセットと、より少ない専門家によるアノテート評価セットからなるDataFinderデータセットを構築した。
このシステムは、DataFinderデータセットに基づいてトレーニングされ、既存のサードパーティのデータセット検索エンジンよりも関連性の高い検索結果を見つける。
論文 参考訳(メタデータ) (2023-05-26T05:22:36Z) - DMDD: A Large-Scale Dataset for Dataset Mentions Detection [43.762713430805455]
本稿では,このタスクで利用可能な最大公用コーパスであるデータセット参照検出データセット(DMDD)を紹介する。
DMDDはDMDDのメインコーパスで構成され、449,000以上のデータセットを持つ31,219の科学論文からなり、インテキストスパンの形式に弱い注釈が付けられている。
DMDD上での各種モデルの性能を解析することにより,データセット参照検出におけるオープンな問題を特定することができる。
論文 参考訳(メタデータ) (2023-05-19T16:18:00Z) - User recommendation system based on MIND dataset [0.0]
MINDデータセットを2019年に収集したシステムに使用します。
本システムでは,単語の埋め込みと表現にGloVeアルゴリズムを用いた。
AUC 71.211, MRR 35.72, nDCG@5 38.05, nDCG@10 44.45の他の関連研究よりも優れた結果が得られる。
論文 参考訳(メタデータ) (2022-09-06T22:25:36Z) - A Multi-Format Transfer Learning Model for Event Argument Extraction via
Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。
変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。
3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文 参考訳(メタデータ) (2022-08-27T13:52:01Z) - Scalable Neural Data Server: A Data Recommender for Transfer Learning [70.06289658553675]
転送学習は、下流のパフォーマンスを改善するために追加データを活用する一般的な戦略である。
Nerve Data Server (NDS)は、特定の下流タスクに関連するデータを推奨する検索エンジンで、この問題に対処するためにこれまで提案されていた。
NDSは、データソースでトレーニングされた専門家の混合物を使用して、各ソースと下流タスクの類似性を推定する。
SNDSは、中間データセットに近接して、データソースと下流タスクの両方を表現します。
論文 参考訳(メタデータ) (2022-06-19T12:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。