論文の概要: 3rd Place Solution to Meta AI Video Similarity Challenge
- arxiv url: http://arxiv.org/abs/2304.11964v1
- Date: Mon, 24 Apr 2023 10:00:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 15:20:16.264449
- Title: 3rd Place Solution to Meta AI Video Similarity Challenge
- Title(参考訳): meta ai video similarity challengeの3位ソリューション
- Authors: Shuhei Yokoo, Peifei Zhu, Junki Ishikawa, Rintaro Hasegawa
- Abstract要約: 本稿では,Meta AI Video similarity Challenge (VSC2022)における3位ソリューションについて述べる。
提案手法は既存の画像コピー検出技術に基づいており,映像データの性質を活かすためのいくつかの戦略を取り入れている。
- 参考スコア(独自算出の注目度): 1.1470070927586016
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents our 3rd place solution in both Descriptor Track and
Matching Track of the Meta AI Video Similarity Challenge (VSC2022), a
competition aimed at detecting video copies. Our approach builds upon existing
image copy detection techniques and incorporates several strategies to exploit
on the properties of video data, resulting in a simple yet powerful solution.
By employing our proposed method, we achieved substantial improvements in
accuracy compared to the baseline results (Descriptor Track: 41% improvement,
Matching Track: 76% improvement). Our code is publicly available here:
https://github.com/line/Meta-AI-Video-Similarity-Challenge-3rd-Place-Solution
- Abstract(参考訳): 本稿では,ビデオコピーの検出を目的としたコンペティションとして,Descriptor Track and Matching Track of the Meta AI Video similarity Challenge (VSC2022)の3位ソリューションを提案する。
提案手法は既存の画像コピー検出技術に基づいており,ビデオデータの性質を活用するためのいくつかの戦略が組み込まれている。
提案手法を用いることで,ベースライン結果と比較して精度が大幅に向上した(ディスクリプタトラック: 41%改善,マッチングトラック: 76%改善)。
私たちのコードはここで公開されている。 https://github.com/line/meta-ai-video- similarity-challenge-3rd-place-solution
関連論文リスト
- Building an Open-Vocabulary Video CLIP Model with Better Architectures,
Optimization and Data [102.0069667710562]
本稿では,CLIPを強力なゼロショットビデオ分類器に適応させるフレームワークであるOpen-VCLIP++を提案する。
我々は,Open-VCLIP++のトレーニングが,履歴データゼロで連続的な学習に欠かせないことを実証した。
提案手法は,広く使用されている3つの行動認識データセットを用いて評価する。
論文 参考訳(メタデータ) (2023-10-08T04:46:43Z) - A Similarity Alignment Model for Video Copy Segment Matching [13.517933749704866]
Meta AIはCVPR 2023でビデオ類似性チャレンジを開催し、テクノロジーを前進させる。
ビデオコピーセグメントマッチングのための類似度アライメントモデルを提案する。
SAMは他の競合他社よりも優れたパフォーマンスを示しています。
論文 参考訳(メタデータ) (2023-05-25T03:08:51Z) - A Dual-level Detection Method for Video Copy Detection [13.517933749704866]
Meta AIはCVPR 2023でビデオ類似性チャレンジを開催し、テクノロジーを前進させる。
本稿では,ビデオ編集検出(VED)とフレームシーン検出(FSD)を併用したデュアルレベル検出手法を提案する。
論文 参考訳(メタデータ) (2023-05-21T06:19:08Z) - Feature-compatible Progressive Learning for Video Copy Detection [30.358206867280426]
ビデオコピー検出(VCD)は、未承認または複製されたビデオコンテンツのインスタンスを特定するために開発された。
本稿では,Meta AI Video similarity Challenge (VSC22), CVPR 2023について述べる。
論文 参考訳(メタデータ) (2023-04-20T13:39:47Z) - Improving ProtoNet for Few-Shot Video Object Recognition: Winner of
ORBIT Challenge 2022 [28.27029433676475]
我々は,ORBIT Few-Shot Video Object Recognition Challenge 2022の入賞ソリューションを提案する。
ProtoNetベースラインを基盤として,提案手法の性能を3つの有効な手法により改善した。
論文 参考訳(メタデータ) (2022-10-01T03:03:20Z) - Deep Video Prior for Video Consistency and Propagation [58.250209011891904]
視覚的ビデオの時間的整合性に対する新規で一般的なアプローチを提案する。
提案手法は,大規模なデータセットではなく,オリジナルビデオとプロセッシングビデオのペアでのみ訓練される。
我々は、Deep Video Priorでビデオ上で畳み込みニューラルネットワークをトレーニングすることで、時間的一貫性を実現することができることを示す。
論文 参考訳(メタデータ) (2022-01-27T16:38:52Z) - Few-Shot Video Object Detection [70.43402912344327]
本稿では,Few-Shot Video Object Detection (FSVOD) を紹介する。
fsvod-500は500のクラスからなり、各カテゴリーにクラスバランスのビデオがある。
私達のTPNおよびTMN+は共同およびエンドツーエンドの訓練されます。
論文 参考訳(メタデータ) (2021-04-30T07:38:04Z) - NTIRE 2021 Challenge on Quality Enhancement of Compressed Video: Methods
and Results [132.53598576262686]
本稿では,圧縮ビデオの品質向上に関する最初のNTIRE課題についてレビューする。
トラック1と2はHEVCが圧縮した動画を固定QPで強化することを目的としており、トラック3はx265で圧縮した動画を固定ビットレートで強化するために設計されている。
提案手法とソリューションは、ビデオ品質向上の最先端を測る。
論文 参考訳(メタデータ) (2021-04-21T22:08:48Z) - Semi-Supervised Action Recognition with Temporal Contrastive Learning [50.08957096801457]
2つの異なる速度でラベル付きビデオを用いて2経路の時間的コントラストモデルを学習する。
我々は最先端の半教師付き画像認識手法の映像拡張性能を著しく向上させた。
論文 参考訳(メタデータ) (2021-02-04T17:28:35Z) - NTIRE 2020 Challenge on Video Quality Mapping: Methods and Results [131.05847851975236]
ビデオ品質マッピング(VQM)におけるNTIRE 2020の課題を概観する。
この課題には、2つのベンチマークデータセットに対して、教師付きトラック(トラック1)と弱い教師付きトラック(トラック2)の両方が含まれる。
トラック1では、合計7チームが最終テストフェーズに出場し、問題に対する新しい効果的な解決策を実証した。
トラック2では、いくつかの既存手法が評価され、弱教師付きビデオ品質マッピング問題に対する有望な解決策が示されている。
論文 参考訳(メタデータ) (2020-05-05T15:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。