論文の概要: Equivalent Classification Mapping for Weakly Supervised Temporal Action
Localization
- arxiv url: http://arxiv.org/abs/2008.07728v2
- Date: Tue, 6 Oct 2020 02:17:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 21:30:01.266104
- Title: Equivalent Classification Mapping for Weakly Supervised Temporal Action
Localization
- Title(参考訳): 弱教師付き時間行動定位のための等価分類マッピング
- Authors: Tao Zhao, Junwei Han, Le Yang, Dingwen Zhang
- Abstract要約: 微弱に監督された時間的行動の局所化は近年、新しく広く研究されているトピックである。
事前分類パイプラインは、まず、各ビデオスニペットの分類を行い、次いで、スニペットレベルの分類スコアを集約して、ビデオレベルの分類スコアを得る。
後分類パイプラインは、まずスニペットレベルの特徴を集約し、集約された特徴に基づいてビデオレベルの分類スコアを予測する。
- 参考スコア(独自算出の注目度): 92.58946210982411
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised temporal action localization is a newly emerging yet widely
studied topic in recent years. The existing methods can be categorized into two
localization-by-classification pipelines, i.e., the pre-classification pipeline
and the post-classification pipeline. The pre-classification pipeline first
performs classification on each video snippet and then aggregate the
snippet-level classification scores to obtain the video-level classification
score. In contrast, the post-classification pipeline aggregates the
snippet-level features first and then predicts the video-level classification
score based on the aggregated feature. Although the classifiers in these two
pipelines are used in different ways, the role they play is exactly the
same---to classify the given features to identify the corresponding action
categories. To this end, an ideal classifier can make both pipelines work. This
inspires us to simultaneously learn these two pipelines in a unified framework
to obtain an effective classifier. Specifically, in the proposed learning
framework, we implement two parallel network streams to model the two
localization-by-classification pipelines simultaneously and make the two
network streams share the same classifier. This achieves the novel Equivalent
Classification Mapping (ECM) mechanism. Moreover, we discover that an ideal
classifier may possess two characteristics: 1) The frame-level classification
scores obtained from the pre-classification stream and the feature aggregation
weights in the post-classification stream should be consistent; 2) The
classification results of these two streams should be identical. Based on these
two characteristics, we further introduce a weight-transition module and an
equivalent training strategy into the proposed learning framework, which
assists to thoroughly mine the equivalence mechanism.
- Abstract(参考訳): 弱い教師付き時間的行動の定位は近年新しく出現し、広く研究されているトピックである。
既存の方法は2つのローカライゼーション・バイ・クラス化パイプライン、すなわち前分類パイプラインと後分類パイプラインに分類することができる。
事前分類パイプラインは、まず各ビデオスニペットに対して分類を行い、次にスニペットレベル分類スコアを集計してビデオレベル分類スコアを得る。
対照的に、後分類パイプラインはまずスニペットレベルの特徴を集約し、集約された特徴に基づいてビデオレベルの分類スコアを予測する。
これら2つのパイプラインの分類器は、異なる方法で使用されるが、それらが果たす役割は全く同じで、与えられた特徴を分類して対応するアクションカテゴリを識別する。
この目的のために、理想的な分類器は両方のパイプラインを動作させることができる。
これにより、これらの2つのパイプラインを統一されたフレームワークで同時に学習し、効果的な分類器を得ることができます。
具体的には,提案する学習フレームワークにおいて2つの並列ネットワークストリームを実装し,2つのローカライゼーションパイプラインを同時にモデル化し,2つのネットワークストリームを同じ分類器で共有する。
これは、新しいECM(Equivalent Classification Mapping)メカニズムを実現する。
さらに,理想的分類器は2つの特性を持つ可能性がある。
1)前分類ストリームから得られたフレームレベルの分類スコアと、後分類ストリームの特徴集約重みとが一致すべきである。
2) この2つのストリームの分類結果は同一であるべきである。
これら2つの特徴に基づき,同値機構の徹底的なマイニングを支援するために,重み遷移モジュールと等価なトレーニング戦略を提案フレームワークに導入する。
関連論文リスト
- Revisiting Foreground and Background Separation in Weakly-supervised
Temporal Action Localization: A Clustering-based Approach [48.684550829098534]
弱教師付き時間的アクションローカライゼーションは、アクションインスタンスをビデオレベルのアクションラベルのみでローカライズすることを目的としている。
クラスタリングに基づく新しいF&B分離アルゴリズムを提案する。
我々は,THUMOS14,ActivityNet v1.2,v1.3の3つのベンチマークで評価を行った。
論文 参考訳(メタデータ) (2023-12-21T18:57:12Z) - GAN for Vision, KG for Relation: a Two-stage Deep Network for Zero-shot
Action Recognition [33.23662792742078]
ゼロショット動作認識のための2段階のディープニューラルネットワークを提案する。
サンプリング段階では,授業の動作特徴と単語ベクトルによって訓練されたGAN(Generative Adversarial Network)を利用する。
分類段階において、アクションクラスの単語ベクトルと関連するオブジェクトの関係に基づいて知識グラフを構築する。
論文 参考訳(メタデータ) (2021-05-25T09:34:42Z) - Hierarchical Modeling for Out-of-Scope Domain and Intent Classification [55.23920796595698]
本稿では,対話システムにおけるスコープ外意図分類に焦点をあてる。
ドメインとインテントを同時に分類する共同モデルに基づく階層型マルチタスク学習手法を提案する。
実験により、モデルが既存の手法よりも精度、スコープ外リコール、F1で優れていることが示された。
論文 参考訳(メタデータ) (2021-04-30T06:38:23Z) - Inducing a hierarchy for multi-class classification problems [11.58041597483471]
分類的ラベルが自然な階層に従ったアプリケーションでは、ラベル構造を利用する分類方法は、そうでないものをしばしば上回る。
本稿では,フラット分類器に対する分類性能を向上できる階層構造を誘導する手法のクラスについて検討する。
原理シミュレーションと3つの実データアプリケーションにおいて、潜入階層の発見と精度向上のためのメソッドのクラスの有効性を実証する。
論文 参考訳(メタデータ) (2021-02-20T05:40:42Z) - A Multiple Classifier Approach for Concatenate-Designed Neural Networks [13.017053017670467]
私たちは、ネットワークセット間で生成された特徴を収集する分類器の設計を与えます。
我々はL2正規化法を用いて、Softmax Denseの代わりに分類スコアを得る。
その結果、提案された分類器は実験ケースの精度を向上させることができる。
論文 参考訳(メタデータ) (2021-01-14T04:32:40Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - Learning Class Regularized Features for Action Recognition [68.90994813947405]
本稿では,階層活性化のクラスベース正規化を行うクラス正規化手法を提案する。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics,UCF-101,HMDB-51データセットにおいて,それぞれ1.8%,1.2%,1.4%の体系的改善が得られた。
論文 参考訳(メタデータ) (2020-02-07T07:27:49Z) - DNNs as Layers of Cooperating Classifiers [5.746505534720594]
ディープニューラルネットワーク(DNN)の一般的な状況下での一般化能力を記述し、予測できる堅牢な理論的枠組みは、いまだ解明されていない。
完全に接続されたフィードフォワードネットワーク内の隠れノードの活性化パターンに興味深い規則性を示す。
これら2つのシステムは,勾配に基づく最適化プロセスから自然に発生し,個別かつ協調的に2つのシステムの分類能力を示す。
論文 参考訳(メタデータ) (2020-01-17T07:45:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。