論文の概要: Discerning Generic Event Boundaries in Long-Form Wild Videos
- arxiv url: http://arxiv.org/abs/2106.10090v1
- Date: Fri, 18 Jun 2021 12:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-21 20:35:35.960212
- Title: Discerning Generic Event Boundaries in Long-Form Wild Videos
- Title(参考訳): 長期野生ビデオにおけるジェネリックイベント境界の識別
- Authors: Ayush K Rai, Tarun Krishna, Julia Dietlmeier, Kevin McGuinness, Alan F
Smeaton, Noel E O'Connor
- Abstract要約: 本稿では,2つのストリームインジェネリックな3次元畳み込みアーキテクチャに基づくイベント境界検出手法を提案する。
私たちの研究はイベント境界検出チャレンジ(CVPR-Long Form Video Understanding LOVEU Workshopの一部)にインスパイアされています。
- 参考スコア(独自算出の注目度): 14.534809843278046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting generic, taxonomy-free event boundaries invideos represents a major
stride forward towards holisticvideo understanding. In this paper we present a
technique forgeneric event boundary detection based on a two stream in-flated
3D convolutions architecture, which can learn spatio-temporal features from
videos. Our work is inspired from theGeneric Event Boundary Detection Challenge
(part of CVPR2021 Long Form Video Understanding- LOVEU Workshop).Throughout the
paper we provide an in-depth analysis ofthe experiments performed along with an
interpretation ofthe results obtained.
- Abstract(参考訳): ビデオ中の一般的な分類なしのイベント境界を検出することは、全体像の理解に向けた大きな一歩である。
本稿では,ビデオから時空間的特徴を学習可能な2つのストリームインフラット3次元畳み込みアーキテクチャに基づくイベント境界検出手法を提案する。
本研究は,先駆的なイベント境界検出チャレンジ(cvpr2021 long form video understanding-loveuワークショップの一部)から着想を得たものである。
関連論文リスト
- Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic
Role Labeling [96.64607294592062]
Video Semantic Label Roleing (VidSRL)は、与えられたビデオから健全なイベントを検出することを目的としている。
近年、VidSRLの手法が提案されているが、2つの重要な欠点を負う可能性がある。
論文 参考訳(メタデータ) (2023-08-09T17:20:14Z) - Generic Event Boundary Detection in Video with Pyramid Features [12.896848011230523]
ジェネリックイベントバウンダリ検出(GEBD)は、人間が自然にイベントバウンダリを知覚する幅広い多様なアクションセットで、ビデオをチャンクに分割することを目的としている。
本稿では,隣接するフレームとピラミッド特徴写像の空間次元と時間次元の相関を考察する。
論文 参考訳(メタデータ) (2023-01-11T03:29:27Z) - Temporal Perceiver: A General Architecture for Arbitrary Boundary
Detection [48.33132632418303]
ジェネリック境界検出(GBD)は、動画をセマンティック・コヒーレントと分類なしの単位に分割する一般的な境界を特定することを目的としている。
従来の研究では、単純なCNNからLSTMまでの複雑なディープネットワークの設計で、これらの異なるレベルの汎用境界を別々に扱っていた。
本稿では,Transformer を用いた汎用アーキテクチャである Temporal Perceiver について述べる。
論文 参考訳(メタデータ) (2022-03-01T09:31:30Z) - Exploring Temporal Granularity in Self-Supervised Video Representation
Learning [99.02421058335533]
本研究は,ビデオ表現学習における時間的グラニュラリティの探索を目的とした,TeGという自己教師型学習フレームワークを提案する。
TeGの柔軟性は、8つのビデオベンチマークで最先端の結果をもたらし、ほとんどの場合、教師付き事前トレーニングよりも優れています。
論文 参考訳(メタデータ) (2021-12-08T18:58:42Z) - Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance
Video [128.41392860714635]
Weakly-Supervised Snoma-Temporally Detection (WSSTAD) を監視ビデオに導入する。
WSSTADは異常事象を封止する時空間管(すなわち連続する境界ボックスのシーケンス)をローカライズすることを目的としている。
本稿では,空間的・時間的領域に複数粒度を持つ入力提案を行うデュアルブランチネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:11:14Z) - A Survey on Deep Learning Technique for Video Segmentation [147.0767454918527]
ビデオセグメンテーションは幅広い応用において重要な役割を果たしている。
ディープラーニングベースのアプローチは、ビデオセグメンテーションに特化しており、魅力的なパフォーマンスを提供している。
論文 参考訳(メタデータ) (2021-07-02T15:51:07Z) - Generic Event Boundary Detection: A Benchmark for Event Segmentation [21.914662894860474]
本稿では,ビデオ全体をチャンクに分割する一般的な分類のないイベント境界を検出するための新しいベンチマークとともに,新しいタスクを提案する。
本稿では,ジェネリックイベント境界検出(GEBD)と新しいベンチマークKinetics-GEBDを提案する。
人間が未来を正確に予測できない地点で境界をマークするという認知的発見に触発されて、教師なしのアプローチを探求する。
論文 参考訳(メタデータ) (2021-01-26T01:31:30Z) - Space-time Neural Irradiance Fields for Free-Viewpoint Video [54.436478702701244]
本稿では,1つのビデオから動的シーンのニューラル照度場を学習する手法を提案する。
私たちの学習した表現は、入力ビデオのフリービューレンダリングを可能にします。
論文 参考訳(メタデータ) (2020-11-25T18:59:28Z) - Spatio-temporal Features for Generalized Detection of Deepfake Videos [12.453288832098314]
我々は3D CNNによってモデル化された時間的特徴を提案し、新しい種類のディープビデオを検出する能力を拡張した。
提案手法は,一般化能力において既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-22T16:28:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。