論文の概要: BSN++: Complementary Boundary Regressor with Scale-Balanced Relation
Modeling for Temporal Action Proposal Generation
- arxiv url: http://arxiv.org/abs/2009.07641v5
- Date: Mon, 1 Mar 2021 08:01:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-10-18 06:35:03.230534
- Title: BSN++: Complementary Boundary Regressor with Scale-Balanced Relation
Modeling for Temporal Action Proposal Generation
- Title(参考訳): BSN++:時間的アクション提案生成のためのスケールベース関係モデリング付き補境界回帰器
- Authors: Haisheng Su, Weihao Gan, Wei Wu, Yu Qiao, Junjie Yan
- Abstract要約: 我々は,時間的提案生成のための補完的境界回帰器と関係モデリングを利用する新しいフレームワークであるBSN++を提案する。
当然のことながら、提案されたBSN++は、時間的アクションローカライゼーションタスクに関するCVPR19 - ActivityNetのリーダーボードで1位にランクインした。
- 参考スコア(独自算出の注目度): 85.13713217986738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating human action proposals in untrimmed videos is an important yet
challenging task with wide applications. Current methods often suffer from the
noisy boundary locations and the inferior quality of confidence scores used for
proposal retrieving. In this paper, we present BSN++, a new framework which
exploits complementary boundary regressor and relation modeling for temporal
proposal generation. First, we propose a novel boundary regressor based on the
complementary characteristics of both starting and ending boundary classifiers.
Specifically, we utilize the U-shaped architecture with nested skip connections
to capture rich contexts and introduce bi-directional boundary matching
mechanism to improve boundary precision. Second, to account for the
proposal-proposal relations ignored in previous methods, we devise a proposal
relation block to which includes two self-attention modules from the aspects of
position and channel. Furthermore, we find that there inevitably exists data
imbalanced problems in the positive/negative proposals and temporal durations,
which harm the model performance on tail distributions. To relieve this issue,
we introduce the scale-balanced re-sampling strategy. Extensive experiments are
conducted on two popular benchmarks: ActivityNet-1.3 and THUMOS14, which
demonstrate that BSN++ achieves the state-of-the-art performance. Not
surprisingly, the proposed BSN++ ranked 1st place in the CVPR19 - ActivityNet
challenge leaderboard on temporal action localization task.
- Abstract(参考訳): 非トリミングビデオで人間のアクション提案を生成することは、広範囲のアプリケーションにおいて重要な課題である。
現在の手法は、しばしばノイズの多い境界位置と、提案検索に使用される信頼スコアの劣る品質に悩まされる。
本稿では,時間的提案生成のための補完的境界回帰と関係モデリングを利用する新しいフレームワークであるBSN++を提案する。
まず,開始と終了の両方の境界分類器の相補的特性に基づく新しい境界回帰器を提案する。
具体的には,ネストしたスキップ接続を持つu字型アーキテクチャを用いてリッチなコンテキストをキャプチャし,境界精度を向上させるために双方向境界マッチング機構を導入する。
次に,従来の手法では無視された提案と提案の関係を考慮し,位置とチャネルの側面から2つの自己対応モジュールを含む提案関係ブロックを考案する。
さらに、正負の提案と時間的継続時間に必然的に不均衡なデータが存在し、テール分布のモデル性能を損なうことが判明した。
この問題を解消するために、スケールバランスの再サンプリング戦略を導入する。
大規模な実験はActivityNet-1.3とTHUMOS14の2つの人気のあるベンチマークで行われ、BSN++が最先端のパフォーマンスを達成することを示す。
当然のことながら、提案されたBSN++は、時間的アクションローカライゼーションタスクに関するCVPR19 - ActivityNetのリーダーボードで1位にランクインした。
関連論文リスト
- Faster Learning of Temporal Action Proposal via Sparse Multilevel
Boundary Generator [9.038216757761955]
ビデオにおける時間的行動のローカライゼーションは、コンピュータビジョンの分野で大きな課題を呈している。
本稿では,境界分類と動作完全性回帰を用いた境界感性手法を改良したSMBG(Sparse Multilevel boundary Generator)を提案する。
提案手法は,ActivityNet-1.3 と THUMOS14 の2つのベンチマークで評価され,より高速な推論速度 (2.47xBSN++, 2.12xDBG) で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-06T14:26:56Z) - Semi-Supervised Temporal Action Detection with Proposal-Free Masking [134.26292288193298]
PropOsal-free Temporal mask (SPOT) に基づく新しい半教師付き時間行動検出モデルを提案する。
SPOTは最先端の代替品よりも優れている。
論文 参考訳(メタデータ) (2022-07-14T16:58:47Z) - Temporal Action Proposal Generation with Background Constraint [25.783837570359267]
時間的アクションプロポーザル生成(TAPG)は、時間的境界のある未トリミングビデオ中のアクションインスタンスを見つけることを目的とした課題である。
提案の信頼性を評価するため、既存の研究は、提案と根本真実の間の時間的相互統合(tIoU)によって監督される提案の行動スコアを予測するのが一般的である。
本稿では,低品質な提案をさらに抑制するための一般的な背景制約概念を革新的に提案する。
論文 参考訳(メタデータ) (2021-12-15T09:20:49Z) - Adaptive Proposal Generation Network for Temporal Sentence Localization
in Videos [58.83440885457272]
ビデオ(TSLV)における時間文ローカライゼーションの問題に対処する。
従来のメソッドは、事前に定義されたセグメントの提案でターゲットセグメントをローカライズするトップダウンフレームワークに従っている。
本稿では,効率を向上しつつセグメントレベルの相互作用を維持するための適応提案生成ネットワーク(APGN)を提案する。
論文 参考訳(メタデータ) (2021-09-14T02:02:36Z) - Temporal Context Aggregation Network for Temporal Action Proposal
Refinement [93.03730692520999]
時間的行動提案生成はビデオ理解分野において難しいが重要な課題である。
現在の方法はまだ不正確な時間境界と検索に使用される劣った自信に苦しんでいます。
TCANet は、「ローカルおよびグローバル」な時間的コンテキストアグリゲーションを通じて、高品質のアクション提案を生成するために提案します。
論文 参考訳(メタデータ) (2021-03-24T12:34:49Z) - Learning Salient Boundary Feature for Anchor-free Temporal Action
Localization [81.55295042558409]
時間的行動のローカライゼーションはビデオ理解において重要な課題である。
純粋にアンカーフリーな時間的定位法を初めて提案する。
このモデルには,(i)エンドツーエンドのトレーニング可能な基本予測器,(ii)サリエンシベースのリファインメントモジュール,(iii)いくつかの一貫性制約が含まれている。
論文 参考訳(メタデータ) (2021-03-24T12:28:32Z) - Boundary Content Graph Neural Network for Temporal Action Proposal
Generation [16.42008388422392]
テンポラルアクションの提案生成は、ビデオアクション理解において重要な役割を果たす。
本稿では,時間的提案の境界と行動内容の洞察力のある関係をモデル化する新しい境界コンテンツグラフニューラルネットワーク(BC-GNN)を提案する。
BC-GNNは、時間的行動提案と時間的行動検出タスクの両方において、最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2020-08-04T09:35:11Z) - Complementary Boundary Generator with Scale-Invariant Relation Modeling
for Temporal Action Localization: Submission to ActivityNet Challenge 2020 [66.4527310659592]
本報告では,ActivityNet Challenge 2020 Task 1への提出時に使用したソリューションの概要を紹介する。
時間的行動ローカライゼーションタスクを2段階(すなわち提案生成と分類)に分離し,提案の多様性を高める。
提案手法は,課題テストセット上での平均mAPを用いて,時間的動作の局所化タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-20T04:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。