論文の概要: VK-LSVD: A Large-Scale Industrial Dataset for Short-Video Recommendation
- arxiv url: http://arxiv.org/abs/2602.04567v1
- Date: Wed, 04 Feb 2026 13:54:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.554962
- Title: VK-LSVD: A Large-Scale Industrial Dataset for Short-Video Recommendation
- Title(参考訳): VK-LSVD:ショートビデオレコメンデーションのための大規模産業データセット
- Authors: Aleksandr Poslavsky, Alexander D'yakonov, Yuriy Dorn, Andrey Zimovnov,
- Abstract要約: 本稿では,VK-LSVD(Large Short-Video dataset)を紹介する。
VK-LSVDは、コンテンツ埋め込み、多様なフィードバック信号、コンテキストメタデータなどの豊富な機能に加えて、これまでになく1000万人のユーザーと約2000万のビデオからの400億以上のインタラクションを提供する。
- 参考スコア(独自算出の注目度): 74.72450521118019
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Short-video recommendation presents unique challenges, such as modeling rapid user interest shifts from implicit feedback, but progress is constrained by a lack of large-scale open datasets that reflect real-world platform dynamics. To bridge this gap, we introduce the VK Large Short-Video Dataset (VK-LSVD), the largest publicly available industrial dataset of its kind. VK-LSVD offers an unprecedented scale of over 40 billion interactions from 10 million users and almost 20 million videos over six months, alongside rich features including content embeddings, diverse feedback signals, and contextual metadata. Our analysis supports the dataset's quality and diversity. The dataset's immediate impact is confirmed by its central role in the live VK RecSys Challenge 2025. VK-LSVD provides a vital, open dataset to use in building realistic benchmarks to accelerate research in sequential recommendation, cold-start scenarios, and next-generation recommender systems.
- Abstract(参考訳): 短いビデオレコメンデーションでは、暗黙のフィードバックからユーザ関心の急激なシフトをモデル化するなど、ユニークな課題が提示されている。
このギャップを埋めるために、我々はVK Large Short-Video Dataset (VK-LSVD)を導入しました。
VK-LSVDは、コンテンツ埋め込み、多様なフィードバック信号、コンテキストメタデータなどの豊富な機能に加えて、これまでになく1000万人のユーザーと約2000万のビデオからの400億以上のインタラクションを提供する。
私たちの分析はデータセットの品質と多様性を支持します。
データセットの直接的な影響は、ライブVK RecSys Challenge 2025における中心的な役割によって確認されている。
VK-LSVDは、シーケンシャルレコメンデーション、コールドスタートシナリオ、次世代レコメンデーションシステムにおける研究を加速するために、現実的なベンチマークを構築するために使用される、必要不可欠なオープンデータセットを提供する。
関連論文リスト
- Impromptu VLA: Open Weights and Open Data for Driving Vision-Language-Action Models [31.566051946153802]
自律走行のためのVLA(Vision-Language-Action)モデルは、非構造的なコーナーケースのシナリオにおいて、将来性を示す。
Inmpromptu VLA: 8万以上の細かなキュレートされたビデオクリップを紹介します。
このデータセットは,4つの挑戦的未構造化カテゴリの新たな分類に基づいて構築され,リッチで計画指向の質問応答アノテーションと行動軌跡を特徴とする。
論文 参考訳(メタデータ) (2025-05-29T17:59:46Z) - Scalable Video-to-Dataset Generation for Cross-Platform Mobile Agents [57.59830804627066]
実世界のモバイルOSナビゲーションをキャプチャする20Kの指導ビデオから,313Kの注釈付きフレームの大規模データセットであるMONDAYを紹介した。
MONDAYを事前学習フェーズに含むモデルは、堅牢なクロスプラットフォームの一般化機能を示す。
公開されているビデオコンテンツを利用して、包括的なタスクデータセットを作成する自動化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T02:39:03Z) - Short-video Propagation Influence Rating: A New Real-world Dataset and A New Large Graph Model [66.8976337702408]
クロスプラットフォームのショートビデオデータセットには、117,720の動画、381,926のサンプル、中国最大の5つのプラットフォームにわたる535のトピックが含まれている。
大グラフモデル(LGM)NetGPTは、多種多様なグラフ構造データを強力な推論能力とLarge Language Models(LLM)の知識で橋渡しすることができる
我々のNetGPTは,短ビデオ伝搬グラフの理解と解析が可能であり,短ビデオの長期伝搬の影響を予測できる。
論文 参考訳(メタデータ) (2025-03-31T05:53:15Z) - Long Video Diffusion Generation with Segmented Cross-Attention and Content-Rich Video Data Curation [16.80010133425332]
長距離コヒーレンスとリッチコンテンツを備えた15秒ビデオを生成するために設計された,新しいビデオ拡散モデルであるPrestoを紹介する。
PrestoはVBench Semantic Scoreで78.5%、Dynamic Degreeで100%のスプリットを達成した。
論文 参考訳(メタデータ) (2024-12-02T09:32:36Z) - LLaVA-Video: Video Instruction Tuning With Synthetic Data [84.64519990333406]
ビデオ命令追従のための高品質な合成データセット、すなわちLLaVA-Video-178Kを作成する。
このデータセットには、詳細なキャプション、オープンエンド質問回答(QA)、複数選択QAといった重要なタスクが含まれている。
このデータセットをトレーニングすることにより、既存の視覚的インストラクションチューニングデータと組み合わせて、新しいビデオLMMであるLLaVA-Videoを導入する。
論文 参考訳(メタデータ) (2024-10-03T17:36:49Z) - CinePile: A Long Video Question Answering Dataset and Benchmark [55.30860239555001]
我々は、CinePileという新しいデータセットとベンチマークを提示する。
包括的データセットは305,000の多重選択質問(MCQ)から構成されており、様々な視覚的・マルチモーダル的な側面をカバーしている。
トレーニングスプリットに関して、オープンソースのVideo-LLMを微調整し、データセットのテストスプリット上で、オープンソースとプロプライエタリなビデオ中心LLMの両方を評価しました。
論文 参考訳(メタデータ) (2024-05-14T17:59:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。