論文の概要: Temporal Fusion Network for Temporal Action Localization:Submission to
ActivityNet Challenge 2020 (Task E)
- arxiv url: http://arxiv.org/abs/2006.07520v1
- Date: Sat, 13 Jun 2020 00:33:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 21:10:42.640730
- Title: Temporal Fusion Network for Temporal Action Localization:Submission to
ActivityNet Challenge 2020 (Task E)
- Title(参考訳): 時間的行動ローカライゼーションのための時間的融合ネットワーク:ActivityNet Challenge 2020への提出(タスクE)
- Authors: Zhiwu Qing, Xiang Wang, Yongpeng Sang, Changxin Gao, Shiwei Zhang,
Nong Sang
- Abstract要約: 本稿では,Activitynet Challenge 2020で開催されているHACSコンペティションで使用した時間的行動ローカライズ手法について分析する。
- 参考スコア(独自算出の注目度): 45.3218136336925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This technical report analyzes a temporal action localization method we used
in the HACS competition which is hosted in Activitynet Challenge 2020.The goal
of our task is to locate the start time and end time of the action in the
untrimmed video, and predict action category.Firstly, we utilize the
video-level feature information to train multiple video-level action
classification models. In this way, we can get the category of action in the
video.Secondly, we focus on generating high quality temporal proposals.For this
purpose, we apply BMN to generate a large number of proposals to obtain high
recall rates. We then refine these proposals by employing a cascade structure
network called Refine Network, which can predict position offset and new IOU
under the supervision of ground truth.To make the proposals more accurate, we
use bidirectional LSTM, Nonlocal and Transformer to capture temporal
relationships between local features of each proposal and global features of
the video data.Finally, by fusing the results of multiple models, our method
obtains 40.55% on the validation set and 40.53% on the test set in terms of
mAP, and achieves Rank 1 in this challenge.
- Abstract(参考訳): 本稿では,アクティベーションネットチャレンジ2020で開催されているHACSコンペティションで使用した時間的行動ローカライズ手法について分析し,その目的は,未編集映像における行動開始時刻と終了時刻の特定とアクションカテゴリーの予測であり,まず,映像レベルの特徴情報を用いて複数の映像レベルの行動分類モデルを訓練することである。
We then refine these proposals by employing a cascade structure network called Refine Network, which can predict position offset and new IOU under the supervision of ground truth.To make the proposals more accurate, we use bidirectional LSTM, Nonlocal and Transformer to capture temporal relationships between local features of each proposal and global features of the video data.Finally, by fusing the results of multiple models, our method obtains 40.55% on the validation set and 40.53% on the test set in terms of mAP, and achieves Rank 1 in this challenge.
- Technical Report for ActivityNet Challenge 2022 -- Temporal Action Localization [20.268572246761895]
論文 参考訳(メタデータ) (2024-10-31T14:16:56Z) - Context-aware Proposal Network for Temporal Action Detection [47.72048484299649]
本報告では,CVPR-2022 AcitivityNet Challengeにおける時間的行動検出タスクの初当選ソリューションについて述べる。
論文 参考訳(メタデータ) (2022-06-18T01:43:43Z) - Transferable Knowledge-Based Multi-Granularity Aggregation Network for
Temporal Action Localization: Submission to ActivityNet Challenge 2021 [33.840281113206444]
本報告では,2021 HACS 時空間行動ローカライゼーションチャレンジの提出に使用したソリューションの概要について述べる。
我々は、TCANet(Temporal Context Aggregation Network)を用いて、高品質なアクション提案を生成する。
提案手法は, 教師付きおよび弱教師付き時間的行動局所化トラックを用いて, 39.91 と 29.78 の平均 mAP をそれぞれ達成する。
論文 参考訳(メタデータ) (2021-07-27T06:18:21Z) - Temporal Context Aggregation Network for Temporal Action Proposal
Refinement [93.03730692520999]
TCANet は、「ローカルおよびグローバル」な時間的コンテキストアグリゲーションを通じて、高品質のアクション提案を生成するために提案します。
論文 参考訳(メタデータ) (2021-03-24T12:34:49Z) - Complementary Boundary Generator with Scale-Invariant Relation Modeling
for Temporal Action Localization: Submission to ActivityNet Challenge 2020 [66.4527310659592]
本報告では,ActivityNet Challenge 2020 Task 1への提出時に使用したソリューションの概要を紹介する。
論文 参考訳(メタデータ) (2020-07-20T04:35:40Z) - Team RUC_AIM3 Technical Report at Activitynet 2020 Task 2: Exploring
Sequential Events Detection for Dense Video Captioning [63.91369308085091]
総合システムは、チャレンジテストセットの9.894 METEORスコアで、ビデオタスクにおける密封イベントの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-06-14T13:21:37Z) - CBR-Net: Cascade Boundary Refinement Network for Action Detection:
Submission to ActivityNet Challenge 2020 (Task 1) [42.77192990307131]
我々は,ActivityNet Challenge 2020において,時間的行動ローカライゼーション(検出)(タスク1)の課題に対する解決策を提示する。
論文 参考訳(メタデータ) (2020-06-13T01:05:51Z) - Weakly-Supervised Multi-Level Attentional Reconstruction Network for
Grounding Textual Queries in Videos [73.4504252917816]
論文 参考訳(メタデータ) (2020-03-16T07:01:01Z)