Fugu-MT 論文翻訳(概要): ContentWise Impressions: An Industrial Dataset with Impressions Included

論文の概要: ContentWise Impressions: An Industrial Dataset with Impressions Included

arxiv url: http://arxiv.org/abs/2008.01212v2
Date: Sat, 19 Sep 2020 12:51:09 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-03 07:16:11.935434
Title: ContentWise Impressions: An Industrial Dataset with Impressions Included
Title（参考訳）: ContentWise Impressions: 印象を含む産業データセット
Authors: Fernando Benjam\'in P\'erez Maurera, Maurizio Ferrari Dacrema, Lorenzo Saule, Mario Scriminaci, Paolo Cremonesi
Abstract要約: ContentWise Impressionsデータセットは、Over-The-Topメディアサービスによる映画とテレビシリーズの暗黙の相互作用と印象の集合である。本稿では,データ収集プロセス,前処理の適用状況,特徴,統計を,他の一般的なデータセットと比較した場合に述べる。データをロードして分割するソフトウェアツールと、ユーザインタラクションとインプレッションの両方を、いくつかの一般的なレコメンデーションアルゴリズムで使用する方法の例をリリースする。
参考スコア（独自算出の注目度）: 68.5068326729525
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this article, we introduce the ContentWise Impressions dataset, a collection of implicit interactions and impressions of movies and TV series from an Over-The-Top media service, which delivers its media contents over the Internet. The dataset is distinguished from other already available multimedia recommendation datasets by the availability of impressions, i.e., the recommendations shown to the user, its size, and by being open-source. We describe the data collection process, the preprocessing applied, its characteristics, and statistics when compared to other commonly used datasets. We also highlight several possible use cases and research questions that can benefit from the availability of user impressions in an open-source dataset. Furthermore, we release software tools to load and split the data, as well as examples of how to use both user interactions and impressions in several common recommendation algorithms.
Abstract（参考訳）: 本稿では,インターネット上でメディアコンテンツを配信するOver-The-Topメディアサービスから,映画とテレビシリーズの暗黙のインタラクションと印象の集合であるContentWise Impressionsデータセットを紹介する。データセットは、インプレッションの可用性、すなわち、ユーザに提示されるレコメンデーション、サイズ、そしてオープンソースであることによって、すでに利用可能な他のマルチメディアレコメンデーションデータセットと区別される。本稿では,データ収集プロセス,前処理の適用状況,特徴,統計を,他の一般的なデータセットと比較した場合に述べる。また、オープンソースデータセットにおけるユーザインプレッションの可用性から恩恵を受けることができるいくつかのユースケースと研究の質問についても強調する。さらに、データをロードして分割するソフトウェアツールや、ユーザインタラクションとインプレッションの両方を複数の一般的な推奨アルゴリズムで使用する方法の例もリリースしています。

関連論文リスト

TEDI: Trustworthy and Ethical Dataset Indicators to Analyze and Compare Dataset Documentation [3.1695945518308366]
マルチモーダルデータセットの信頼性と倫理的属性を特徴付ける143の指標を含むTEDIを紹介する。 TEDIを用いて、人間の声を含む100以上のマルチモーダルデータセットを手動でアノテートし分析した。同意、プライバシー、有害なコンテンツ指標に関連する属性やプラクティスを文書化したデータセットは、ごくわずかしかありません。
論文参考訳（メタデータ） (2025-05-23T12:55:33Z)
Multi-Record Web Page Information Extraction From News Websites [83.88591755871734]
本稿では,多数のレコードを含むWebページから情報を抽出する問題に焦点をあてる。このギャップに対処するため、リストページ用に設計された大規模なオープンアクセスデータセットを作成しました。我々のデータセットには13,120のWebページとニュースリストがあり、スケールと複雑さの両方で既存のデータセットをはるかに上回っている。
論文参考訳（メタデータ） (2025-02-20T15:05:00Z)
Movie Recommendation using Web Crawling [1.821917087370735]
本稿では,HTMLスクレイピング技術とAPIを用いた人気映画サイトからのリアルタイムデータの統合について検討する。また、静的なKaggleデータセットでトレーニングされたレコメンデーションシステムも組み込まれており、提案の妥当性と鮮度が向上している。
論文参考訳（メタデータ） (2024-12-14T06:56:46Z)
Data Distribution Valuation [56.71023681599737]
既存のデータバリュエーションメソッドは、離散データセットの値を定義します。多くのユースケースでは、ユーザはデータセットの値だけでなく、データセットがサンプリングされた分布の値にも興味を持っています。本稿では,理論的原理と実行可能なポリシを実現するための,MMDに基づく評価手法を提案する。
論文参考訳（メタデータ） (2024-10-06T07:56:53Z)
Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文参考訳（メタデータ） (2024-07-20T17:14:31Z)
Uncovering the Interaction Equation: Quantifying the Effect of User Interactions on Social Media Homepage Recommendations [0.5030361857850012]
これまでのユーザーインタラクションが、YouTube、Reddit、X(旧Twitter)の3大プラットフォームにわたるユーザーのホームページフィードに提示されたコンテンツにどのように影響するかを調査する。我々は、ホームページコンテンツに対する特定のユーザーインタラクションの影響を明らかにすることのできるデータを収集するために、慎重に設計された一連の実験を使用する。本研究は,各プラットフォームが使用するコンテンツキュレーションアルゴリズムの動作,ユーザインタラクションに対する反応,および特定のトピックの優先順位付けの証拠を明らかにする。
論文参考訳（メタデータ） (2024-07-09T20:47:34Z)
Attention-based sequential recommendation system using multimodal data [8.110978727364397]
本稿では,画像やテキスト,カテゴリといった項目のマルチモーダルなデータを用いた注意に基づくシーケンシャルレコメンデーション手法を提案する。 Amazonデータセットから得られた実験結果は,提案手法が従来の逐次レコメンデーションシステムよりも優れていることを示している。
論文参考訳（メタデータ） (2024-05-28T08:41:05Z)
[Citation needed] Data usage and citation practices in medical imaging conferences [1.9702506447163306]
データセットの使用状況の検出を支援するオープンソースツールを2つ提示する。本研究は,MICCAIおよびMIDLの論文における20の公開医療データセットの使用状況について検討した。以上の結果から,限られたデータセット群の使用率の上昇が示唆された。
論文参考訳（メタデータ） (2024-02-05T13:41:22Z)
Impression-Aware Recommender Systems [57.38537491535016]
新たなデータソースは、レコメンデーションシステムの品質を改善する新しい機会をもたらす。研究者はインプレッションを使ってユーザーの好みを洗練させ、推奨システム研究の現在の制限を克服することができる。本稿ではインプレッションを用いたレコメンデーションシステムに関する体系的な文献レビューを行う。
論文参考訳（メタデータ） (2023-08-15T16:16:02Z)
MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation of Videos [106.06278332186106]
マルチモーダル・アウトプット(MSMO)を用いたマルチモーダル・サマリゼーションが有望な研究方向として浮上している。既存のパブリックMSMOデータセットには多くの制限がある。 textbfMMSumデータセットを精巧にキュレートした。
論文参考訳（メタデータ） (2023-06-07T07:43:11Z)
infoVerse: A Universal Framework for Dataset Characterization with Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。 infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文参考訳（メタデータ） (2023-05-30T18:12:48Z)
Revisiting Table Detection Datasets for Visually Rich Documents [17.846536373106268]
この研究では、高品質なアノテーションでいくつかのオープンデータセットを再検討し、ノイズを特定し、クリーン化し、これらのデータセットのアノテーション定義を、Open-Tablesと呼ばれるより大きなデータセットとマージするように調整する。情報通信技術(ICT)コモディティのPDFファイルを用いた新しいICT-TDデータセットを提案する。実験の結果,データソースが異なるにも関わらず,既存のオープンデータセット間の領域差は小さいことがわかった。
論文参考訳（メタデータ） (2023-05-04T01:08:15Z)
Modeling Entities as Semantic Points for Visual Information Extraction in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文参考訳（メタデータ） (2023-03-23T08:21:16Z)
Media Cloud: Massive Open Source Collection of Global News on the Open Web [40.52153096219742]
Media Cloudは、クロールハイパーリンク構造をベースとしたオープンソースプラットフォームで、10年以上にわたって運用されてきた。 Media Cloudが収集して保存するデータ、それらのデータの処理と整理方法、オープンなAPIアクセス、そしてユーザ向けツールの背後にある重要な選択肢を文書化しています。我々は、Media Cloudを使って生成された2つのサンプルデータセットの概要を説明し、研究者がこのプラットフォームを使って独自のデータセットを作成する方法について論じる。
論文参考訳（メタデータ） (2021-04-08T11:51:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。