論文の概要: Action Recognition with Deep Multiple Aggregation Networks
- arxiv url: http://arxiv.org/abs/2006.04489v1
- Date: Mon, 8 Jun 2020 11:37:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 02:01:12.010840
- Title: Action Recognition with Deep Multiple Aggregation Networks
- Title(参考訳): ディープマルチアグリゲーションネットワークを用いた行動認識
- Authors: Ahmed Mazari and Hichem Sahbi
- Abstract要約: 動作認識における時間的粒度の異なるレベルをキャプチャする新しい階層型プール設計を提案する。
我々の設計原則は粗大であり、木構造ネットワークを用いて達成される。
原理と基礎が整っただけでなく、提案された階層的なプーリングもビデオ長と解像度に依存しない。
- 参考スコア(独自算出の注目度): 14.696233190562936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of the current action recognition algorithms are based on deep networks
which stack multiple convolutional, pooling and fully connected layers. While
convolutional and fully connected operations have been widely studied in the
literature, the design of pooling operations that handle action recognition,
with different sources of temporal granularity in action categories, has
comparatively received less attention, and existing solutions rely mainly on
max or averaging operations. The latter are clearly powerless to fully exhibit
the actual temporal granularity of action categories and thereby constitute a
bottleneck in classification performances. In this paper, we introduce a novel
hierarchical pooling design that captures different levels of temporal
granularity in action recognition. Our design principle is coarse-to-fine and
achieved using a tree-structured network; as we traverse this network top-down,
pooling operations are getting less invariant but timely more resolute and well
localized. Learning the combination of operations in this network -- which best
fits a given ground-truth -- is obtained by solving a constrained minimization
problem whose solution corresponds to the distribution of weights that capture
the contribution of each level (and thereby temporal granularity) in the global
hierarchical pooling process. Besides being principled and well grounded, the
proposed hierarchical pooling is also video-length and resolution agnostic.
Extensive experiments conducted on the challenging UCF-101, HMDB-51 and
JHMDB-21 databases corroborate all these statements.
- Abstract(参考訳): 現在のアクション認識アルゴリズムのほとんどは、複数の畳み込み層、プール層、完全に接続された層を積み重ねるディープネットワークに基づいている。
畳み込みと完全連結な操作は文献で広く研究されているが、アクション認識を扱うプーリング操作の設計は、アクションカテゴリーの時間的粒度が異なるため、比較的注意が払われておらず、既存のソリューションは主に最大または平均演算に依存している。
後者は明らかに、アクションカテゴリの実際の時間的粒度を完全に示さないため、分類性能のボトルネックとなる。
本稿では,行動認識における時間的粒度の異なる階層的なプール設計を提案する。
このネットワークをトップダウンに横切ると、プール操作は不変性が少なくなりつつも、時間的に絶対的かつ局所性が良くなっています。
このネットワークにおける操作の組み合わせを学習することは、その解が、大域的な階層的プーリングプロセスにおける各レベル(つまり、時間的粒度)の寄与を捉える重みの分布に対応する制約付き最小化問題を解くことによって得られる。
原理と基礎性に加えて、提案された階層型プーリングもビデオ長と解像度に依存しない。
挑戦的なUCF-101、HMDB-51、JHMDB-21データベースに関する大規模な実験は、これらの全ての主張を裏付けるものである。
関連論文リスト
- Joint Learning for Scattered Point Cloud Understanding with Hierarchical
Self-Distillation [37.42845400904313]
そこで本研究では,部分点雲を高速に補正し,同定するエンド・ツー・エンドアーキテクチャを提案する。
階層型自己蒸留(HSD)は任意の階層ベースの点雲法に適用できる。
論文 参考訳(メタデータ) (2023-12-28T08:51:04Z) - A Multi-objective Complex Network Pruning Framework Based on
Divide-and-conquer and Global Performance Impairment Ranking [40.59001171151929]
本稿では,多目的複合ネットワークプルーニングフレームワークを提案する。
提案アルゴリズムは,最先端プルーニング手法と同等の性能を実現する。
論文 参考訳(メタデータ) (2023-03-28T12:05:15Z) - SIRe-Networks: Skip Connections over Interlaced Multi-Task Learning and
Residual Connections for Structure Preserving Object Classification [28.02302915971059]
本稿では、オブジェクト分類タスクにおける消失勾配を低減するために、SIReを定義したインターレース型マルチタスク学習戦略を提案する。
提案手法は、自動エンコーダを介して入力画像構造を保存することにより、畳み込みニューラルネットワーク(CNN)を直接改善する。
提案手法を検証するため、SIRe戦略を介して単純なCNNと有名なネットワークの様々な実装を拡張し、CIFAR100データセットで広範囲にテストする。
論文 参考訳(メタデータ) (2021-10-06T13:54:49Z) - Locality Matters: A Scalable Value Decomposition Approach for
Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。
本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文 参考訳(メタデータ) (2021-09-22T10:08:15Z) - Unsupervised Domain-adaptive Hash for Networks [81.49184987430333]
ドメイン適応型ハッシュ学習はコンピュータビジョンコミュニティでかなりの成功を収めた。
UDAHと呼ばれるネットワークのための教師なしドメイン適応型ハッシュ学習手法を開発した。
論文 参考訳(メタデータ) (2021-08-20T12:09:38Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - All at Once Network Quantization via Collaborative Knowledge Transfer [56.95849086170461]
オールオンス量子化ネットワークを効率的にトレーニングするための新しい共同知識伝達アプローチを開発しています。
具体的には、低精度の学生に知識を伝達するための高精度のエンクォータを選択するための適応的選択戦略を提案する。
知識を効果的に伝達するために,低精度の学生ネットワークのブロックを高精度の教師ネットワークのブロックにランダムに置き換える動的ブロックスワッピング法を開発した。
論文 参考訳(メタデータ) (2021-03-02T03:09:03Z) - Recursive Multi-model Complementary Deep Fusion forRobust Salient Object
Detection via Parallel Sub Networks [62.26677215668959]
完全畳み込みネットワークは、正体検出(SOD)分野において優れた性能を示している。
本稿では,全く異なるネットワークアーキテクチャを持つ並列サブネットワークからなる,より広いネットワークアーキテクチャを提案する。
いくつかの有名なベンチマークの実験では、提案されたより広範なフレームワークの優れた性能、優れた一般化、強力な学習能力が明らかに示されている。
論文 参考訳(メタデータ) (2020-08-07T10:39:11Z) - Deep hierarchical pooling design for cross-granularity action
recognition [14.696233190562936]
本稿では,行動認識における時間的粒度の異なる階層的アグリゲーション設計を提案する。
制約最小化問題の解法により,このネットワークにおける演算の組み合わせを学習する。
原則と基礎が整っただけでなく、提案された階層的なプーリングもビデオ長であり、動作のミスアライメントに耐性がある。
論文 参考訳(メタデータ) (2020-06-08T11:03:54Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。