論文の概要: Hierarchical Action Classification with Network Pruning
- arxiv url: http://arxiv.org/abs/2007.15244v1
- Date: Thu, 30 Jul 2020 05:49:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 13:41:55.463609
- Title: Hierarchical Action Classification with Network Pruning
- Title(参考訳): ネットワークプラニングによる階層的行動分類
- Authors: Mahdi Davoodikakhki, KangKang Yin
- Abstract要約: 本稿では,階層分類,ネットワークプルーニング,スケルトンに基づく前処理など,補助的な機構の活用について述べる。
本手法の有効性を4つのテストデータセットで検証する。
- 参考スコア(独自算出の注目度): 1.827510863075184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Research on human action classification has made significant progresses in
the past few years. Most deep learning methods focus on improving performance
by adding more network components. We propose, however, to better utilize
auxiliary mechanisms, including hierarchical classification, network pruning,
and skeleton-based preprocessing, to boost the model robustness and
performance. We test the effectiveness of our method on four commonly used
testing datasets: NTU RGB+D 60, NTU RGB+D 120, Northwestern-UCLA Multiview
Action 3D, and UTD Multimodal Human Action Dataset. Our experiments show that
our method can achieve either comparable or better performance on all four
datasets. In particular, our method sets up a new baseline for NTU 120, the
largest dataset among the four. We also analyze our method with extensive
comparisons and ablation studies.
- Abstract(参考訳): 人間の行動分類の研究はここ数年で大きな進歩を遂げてきた。
ほとんどのディープラーニングメソッドは、ネットワークコンポーネントの追加によるパフォーマンス向上に重点を置いています。
しかし,階層分類,ネットワークプルーニング,スケルトンベース前処理などの補助機構をより有効に活用し,モデルのロバスト性と性能を向上させることを提案する。
NTU RGB+D 60, NTU RGB+D 120, Northwestern-UCLA Multiview Action 3D, UTD Multimodal Human Action Dataset の4つのテストデータセットで本手法の有効性を検証する。
実験の結果,本手法は4つのデータセットに匹敵する,あるいは優れた性能を達成できることがわかった。
特に,本手法では,NTU 120の新たなベースラインを設定している。
また,本手法を広範囲な比較とアブレーション研究により分析した。
関連論文リスト
- Modern Neighborhood Components Analysis: A Deep Tabular Baseline Two Decades Later [59.88557193062348]
我々は、インスタンス間のセマンティックな類似性をキャプチャする線形射影を学習するために設計された古典的近傍成分分析(NCA)を再考する。
学習目的の調整や深層学習アーキテクチャの統合といった微調整は,NAAの性能を著しく向上させることがわかった。
また,提案したModernNCAの効率性と予測精度を向上する,近隣のサンプリング戦略も導入する。
論文 参考訳(メタデータ) (2024-07-03T16:38:57Z) - MA4DIV: Multi-Agent Reinforcement Learning for Search Result Diversification [30.877906895698807]
我々は,MARL(Multi-Agent reinforcement learning)を検索結果のDIVersity(MA4DIV)に導入する。
このアプローチでは、各文書はエージェントであり、検索結果の多様化は複数のエージェント間の協調的なタスクとしてモデル化される。
我々は,MA4DIVが産業規模データセット上の既存のベースラインよりも有効性と効率の両面で大幅に向上していることを示す。
論文 参考訳(メタデータ) (2024-03-26T06:34:23Z) - Deep Active Learning with Structured Neural Depth Search [18.180995603975422]
Active-iNASは、複数のモデルを訓練し、各アクティブラーニングサイクルの後に、その後のサンプルをクエリする最適な一般化性能でモデルを選択する。
本稿では,SVI(Structured Variational Inference)あるいはSNDS(Structured Neural Deep Search)と呼ばれる手法を用いた新しいアクティブ戦略を提案する。
同時に、理論上は、平均場推定に基づく現在のVIベースの手法が性能を低下させる可能性があることを実証している。
論文 参考訳(メタデータ) (2023-06-05T12:00:12Z) - Weighted Ensemble Self-Supervised Learning [67.24482854208783]
組み立ては、モデルパフォーマンスを高めるための強力なテクニックであることが証明されている。
我々は,データ依存型重み付きクロスエントロピー損失を許容するフレームワークを開発した。
提案手法は、ImageNet-1K上での複数の評価指標において、両者に優れる。
論文 参考訳(メタデータ) (2022-11-18T02:00:17Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - UNIK: A Unified Framework for Real-world Skeleton-based Action
Recognition [11.81043814295441]
UNIKは、データセットをまたいで一般化できる新しい骨格に基づく行動認識手法である。
実世界のビデオにおける行動認識のクロスドメイン一般化可能性について検討するため,提案したUNIKと同様に最先端のアプローチを再評価する。
その結果,提案したUNIKは,Poseticsを事前学習した上で,4つのターゲットアクション分類データセットに転送した場合に,最先端の処理性能を向上することがわかった。
論文 参考訳(メタデータ) (2021-07-19T02:00:28Z) - Joint-DetNAS: Upgrade Your Detector with NAS, Pruning and Dynamic
Distillation [49.421099172544196]
オブジェクト検出のための統一NASフレームワークであるJoint-DetNASを提案する。
Joint-DetNASは、Neural Architecture Search、pruning、Knowledge Distillationの3つの重要なコンポーネントを統合している。
提案アルゴリズムは, 外部学習を伴わずに, 高い性能で直接出力する。
論文 参考訳(メタデータ) (2021-05-27T07:25:43Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Point Transformer for Shape Classification and Retrieval of 3D and ALS
Roof PointClouds [3.3744638598036123]
本稿では,リッチポイントクラウド表現の導出を目的とした,完全注意モデルであるem Point Transformerを提案する。
モデルの形状分類と検索性能は,大規模都市データセット - RoofN3D と標準ベンチマークデータセット ModelNet40 で評価される。
提案手法は、RoofN3Dデータセットの他の最先端モデルよりも優れており、ModelNet40ベンチマークで競合する結果を与え、目に見えない点の破損に対して高い堅牢性を示す。
論文 参考訳(メタデータ) (2020-11-08T08:11:02Z) - DrNAS: Dirichlet Neural Architecture Search [88.56953713817545]
ディリクレ分布をモデルとした連続緩和型混合重みをランダム変数として扱う。
最近開発されたパスワイズ微分により、ディリクレパラメータは勾配に基づく一般化で容易に最適化できる。
微分可能なNASの大きなメモリ消費を軽減するために, 単純かつ効果的な進行学習方式を提案する。
論文 参考訳(メタデータ) (2020-06-18T08:23:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。