論文の概要: The Effects of Short Video-Sharing Services on Video Copy Detection
- arxiv url: http://arxiv.org/abs/2403.18158v1
- Date: Tue, 26 Mar 2024 23:47:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 18:55:29.756992
- Title: The Effects of Short Video-Sharing Services on Video Copy Detection
- Title(参考訳): ビデオコピー検出におけるショートビデオ共有サービスの効果
- Authors: Rintaro Yanagi, Yamato Okamoto, Shuhei Yokoo, Shin'ichi Satoh,
- Abstract要約: 10秒から30秒間のビデオを投稿できる短いビデオ共有サービスが近年注目を集めている。
本稿では,短いビデオ共有サービスがビデオコピー検出に与える影響について検討する。
我々の新しいデータセットは、公開されているデータセットから自動的に構築され、参照ビデオと固定された短時間のクエリビデオを持つ。
- 参考スコア(独自算出の注目度): 7.924825576935777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The short video-sharing services that allow users to post 10-30 second videos (e.g., YouTube Shorts and TikTok) have attracted a lot of attention in recent years. However, conventional video copy detection (VCD) methods mainly focus on general video-sharing services (e.g., YouTube and Bilibili), and the effects of short video-sharing services on video copy detection are still unclear. Considering that illegally copied videos in short video-sharing services have service-distinctive characteristics, especially in those time lengths, the pros and cons of VCD in those services are required to be analyzed. In this paper, we examine the effects of short video-sharing services on VCD by constructing a dataset that has short video-sharing service characteristics. Our novel dataset is automatically constructed from the publicly available dataset to have reference videos and fixed short-time-length query videos, and such automation procedures assure the reproducibility and data privacy preservation of this paper. From the experimental results focusing on segment-level and video-level situations, we can see that three effects: "Segment-level VCD in short video-sharing services is more difficult than those in general video-sharing services", "Video-level VCD in short video-sharing services is easier than those in general video-sharing services", "The video alignment component mainly suppress the detection performance in short video-sharing services".
- Abstract(参考訳): 10秒から30秒間のビデオを投稿できる短いビデオ共有サービス(YouTube Shorts、TikTokなど)が近年注目を集めている。
しかし、従来のビデオコピー検出(VCD)手法は主に一般的なビデオ共有サービス(YouTubeやBilibiliなど)に焦点を当てており、ビデオコピー検出に対する短いビデオ共有サービスの影響はいまだ不明である。
短いビデオ共有サービスにおいて、違法にコピーされたビデオは、特にその時間長において、サービス固有の特性を持つので、それらのサービスのVCDの長所と短所を解析する必要がある。
本稿では,短いビデオ共有サービス特性を持つデータセットを構築することにより,VCDに対する短いビデオ共有サービスの効果を検討する。
我々の新しいデータセットは、参照ビデオと固定された短時間のクエリビデオを持つために、公開されているデータセットから自動的に構築され、このような自動化手順により、本論文の再現性とデータプライバシ保護が保証される。
セグメントレベルとビデオレベルに着目した実験結果から,「ビデオ共有サービスにおけるセグメントレベルVCDは一般のビデオ共有サービスよりも難しい」「ビデオ共有サービスにおけるビデオレベルVCDは一般ビデオ共有サービスよりも容易」,「ビデオアライメントコンポーネントは短ビデオ共有サービスにおける検出性能を主に抑制している」の3つの効果が示された。
関連論文リスト
- Video-RAG: Visually-aligned Retrieval-Augmented Long Video Comprehension [83.00346826110041]
Video-RAGはトレーニング不要で費用対効果の高いパイプラインで、視覚的に整列した補助テキストを使って、モダリティ間のアライメントを促進する。
72Bモデルを用いた場合,Gemini-1.5-Pro や GPT-4o などのプロプライエタリモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-11-20T07:44:34Z) - Multi-sentence Video Grounding for Long Video Generation [46.363084926441466]
長大映像生成のための多文ビデオグラウンドの勇敢で新しいアイデアを提案する。
提案手法は,画像・ビデオ編集,ビデオモーフィング,パーソナライズド生成,ビデオグラウンドニングの発達を,長いビデオ生成にシームレスに拡張する。
論文 参考訳(メタデータ) (2024-07-18T07:05:05Z) - Beyond the Frame: Single and mutilple video summarization method with
user-defined length [4.424739166856966]
ビデオの要約は難しいが重要な作業であり、さらなる研究と開発にかなりの可能性がある。
本稿では,NLP技術とビデオ処理技術を組み合わせて,長い動画を比較的短いビデオに変換する。
論文 参考訳(メタデータ) (2023-12-23T04:32:07Z) - Video Generation Beyond a Single Clip [76.5306434379088]
ビデオ生成モデルは、実際のビデオの長さと比較して比較的短いビデオクリップしか生成できない。
多様なコンテンツや複数のイベントをカバーした長いビデオを生成するために,ビデオ生成プロセスを制御するための追加のガイダンスを提案する。
提案手法は、固定時間ウィンドウ内でリアルな映像を生成することに焦点を当てた、既存の映像生成の取り組みを補完するものである。
論文 参考訳(メタデータ) (2023-04-15T06:17:30Z) - Partially Relevant Video Retrieval [39.747235541498135]
PRVR(Partially Relevant Video Retrieval)と呼ばれる新しいT2VRサブタスクを提案する。
PRVRは、未トリミングビデオの大規模なコレクションから、部分的に関連のあるビデオを取得することを目的としている。
PRVRをマルチインスタンス学習(MIL)問題として定式化し、ビデオクリップの袋とビデオフレームの袋とを同時に見る。
論文 参考訳(メタデータ) (2022-08-26T09:07:16Z) - VRAG: Region Attention Graphs for Content-Based Video Retrieval [85.54923500208041]
Region Attention Graph Networks (VRAG) は最先端のビデオレベルの手法を改善している。
VRAGは、地域レベルの特徴を通して、より細かい粒度のビデオを表現し、地域レベルの関係を通して、ビデオ時間ダイナミクスをエンコードする。
本研究では,映像のセグメント化や映像検索にショット埋め込みを用いることで,映像レベルとフレームレベルの性能差を低減できることを示す。
論文 参考訳(メタデータ) (2022-05-18T16:50:45Z) - An Annotated Video Dataset for Computing Video Memorability [3.660907225956466]
1,275のユーザは、ビデオの長期記憶と短期記憶の両方を示すために、各ビデオに手動で注釈を付けている。
認識タスクは、過去数分間のビデオで、短期記憶のために、過去24時間から72時間で、長期記憶のために行われた。
このデータセットは、2020年のMediaEvalベンチマークの一部として、Video Memorabilityタスクで使用された。
論文 参考訳(メタデータ) (2021-12-04T10:42:38Z) - Less is More: ClipBERT for Video-and-Language Learning via Sparse
Sampling [98.41300980759577]
ビデオと言語の学習に対する標準的なアプローチは、オフラインで抽出された高密度ビデオ機能から学習するニューラルネットワークを規定する。
本稿では,ビデオ・言語タスクに対して,手頃なエンドツーエンド学習を可能にする汎用フレームワークClipBERTを提案する。
6つのデータセットにおけるテキスト・ビデオ検索とビデオ質問応答の実験は、ClipBERTが既存の手法より優れていることを示した。
論文 参考訳(メタデータ) (2021-02-11T18:50:16Z) - Efficient video integrity analysis through container characterization [77.45740041478743]
本稿では,ビデオ操作に使用するソフトウェアをコンテナベースで識別する手法を提案する。
提案手法は効率的かつ効果的であり,その決定の簡易な説明も可能である。
プリストインを改ざんされたビデオと区別し、編集ソフトを分類することで97.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-01-26T14:13:39Z) - Localizing the Common Action Among a Few Videos [51.09824165433561]
本論文は,長編ビデオにおける動作の時間的範囲をローカライズする試みである。
サポートビデオからの表現を関連するクエリビデオセグメントと整合させることができる新しい3D畳み込みネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-08-13T11:31:23Z) - A gaze driven fast-forward method for first-person videos [2.362412515574206]
我々は、入力ビデオの高速化版を作成し、重要な瞬間をレコーダーに強調することにより、ファースト・パーソン・ビデオにおける関連情報へのアクセスの問題に対処する。
本手法は,映像の各フレームのセマンティックスコアを提供する,視線と視覚的シーン分析によって駆動される注目モデルに基づく。
論文 参考訳(メタデータ) (2020-06-10T00:08:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。