論文の概要: Dynamic Spatio-Temporal Specialization Learning for Fine-Grained Action
Recognition
- arxiv url: http://arxiv.org/abs/2209.01425v1
- Date: Sat, 3 Sep 2022 13:59:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 13:57:02.206437
- Title: Dynamic Spatio-Temporal Specialization Learning for Fine-Grained Action
Recognition
- Title(参考訳): きめ細かい行動認識のための動的時空間特殊化学習
- Authors: Tianjiao Li, Lin Geng Foo, Qiuhong Ke, Hossein Rahmani, Anran Wang,
Jinghua Wang, Jun Liu
- Abstract要約: 我々は、特定のタスクを扱う専門領域を含む人間の視覚システムからインスピレーションを得た。
我々は、非常に類似したサンプルのサブセットに対してのみ活性化される特別なニューロンからなる新しい動的動的時空間サブセット(DSTS)を設計する。
トレーニング中のモデルの動的決定を最適化し,DSTSモジュールの性能を向上させるために,UpstreamDownstream Learningアルゴリズムを設計する。
- 参考スコア(独自算出の注目度): 19.562218963941227
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of fine-grained action recognition is to successfully discriminate
between action categories with subtle differences. To tackle this, we derive
inspiration from the human visual system which contains specialized regions in
the brain that are dedicated towards handling specific tasks. We design a novel
Dynamic Spatio-Temporal Specialization (DSTS) module, which consists of
specialized neurons that are only activated for a subset of samples that are
highly similar. During training, the loss forces the specialized neurons to
learn discriminative fine-grained differences to distinguish between these
similar samples, improving fine-grained recognition. Moreover, a
spatio-temporal specialization method further optimizes the architectures of
the specialized neurons to capture either more spatial or temporal fine-grained
information, to better tackle the large range of spatio-temporal variations in
the videos. Lastly, we design an Upstream-Downstream Learning algorithm to
optimize our model's dynamic decisions during training, improving the
performance of our DSTS module. We obtain state-of-the-art performance on two
widely-used fine-grained action recognition datasets.
- Abstract(参考訳): きめ細かい行動認識の目標は、微妙な違いを伴う行動カテゴリをうまく判別することである。
そこで本研究では,脳内の特定の領域を具体化して,特定の課題に対処するための視覚システムからインスピレーションを得た。
我々は、非常に類似したサンプルのサブセットに対してのみ活性化される特別なニューロンからなる新しい動的時空間特殊化(DSTS)モジュールを設計する。
訓練中は、特定のニューロンに識別的微細な違いを学習させ、これらの類似したサンプルを区別させ、きめ細かい認識を改善する。
さらに、時空間特殊化手法は、より空間的または時間的細かな情報をキャプチャするために、特殊ニューロンのアーキテクチャをさらに最適化し、ビデオの時空間的変化の広い範囲に取り組む。
最後に、トレーニング中のモデルの動的決定を最適化し、dstsモジュールの性能を向上させるために、上流下流学習アルゴリズムを設計する。
広く使われている2つの細粒度アクション認識データセットで最先端のパフォーマンスを得る。
関連論文リスト
- Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.68088298632865]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - TS-MoCo: Time-Series Momentum Contrast for Self-Supervised Physiological
Representation Learning [8.129782272731397]
ラベルを必要とせずに様々な生理領域から表現を学習するために,モーメントコントラストを持つ自己教師型学習に依存した新しい符号化フレームワークを提案する。
我々の自己教師型学習アプローチは、下流の分類タスクで活用できる差別的特徴を実際に学習できることを示します。
論文 参考訳(メタデータ) (2023-06-10T21:17:42Z) - Learning low-dimensional dynamics from whole-brain data improves task
capture [2.82277518679026]
逐次変分オートエンコーダ(SVAE)を用いたニューラルダイナミクスの低次元近似学習手法を提案する。
本手法は,従来の手法よりも精度の高い認知過程を予測できるスムーズなダイナミクスを見出す。
我々は、モータ、ワーキングメモリ、リレーショナル処理タスクを含む様々なタスクfMRIデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-05-18T18:43:13Z) - Leaping Into Memories: Space-Time Deep Feature Synthesis [93.10032043225362]
内部モデルから映像を合成するアーキテクチャ非依存の手法であるLEAPSを提案する。
我々は,Kineetics-400に基づく多種多様なアーキテクチャの進化的注目を反転させることにより,LEAPSの適用性を定量的かつ定性的に評価する。
論文 参考訳(メタデータ) (2023-03-17T12:55:22Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Model-Based Deep Learning: On the Intersection of Deep Learning and
Optimization [101.32332941117271]
決定アルゴリズムは様々なアプリケーションで使われている。
数理モデルに頼らずにデータから調整された高度パラメトリックアーキテクチャを使用するディープラーニングアプローチが、ますます人気が高まっている。
モデルに基づく最適化とデータ中心のディープラーニングは、しばしば異なる規律とみなされる。
論文 参考訳(メタデータ) (2022-05-05T13:40:08Z) - EEGminer: Discovering Interpretable Features of Brain Activity with
Learnable Filters [72.19032452642728]
本稿では,学習可能なフィルタと事前決定された特徴抽出モジュールからなる新しい識別可能なEEGデコーディングパイプラインを提案する。
我々は,SEEDデータセットおよび前例のない大きさの新たな脳波データセット上で,脳波信号からの感情認識に向けたモデルの有用性を実証する。
発見された特徴は、以前の神経科学の研究と一致し、音楽聴取中の左右の時間領域間の機能的接続プロファイルの顕著な相違など、新たな洞察を提供する。
論文 参考訳(メタデータ) (2021-10-19T14:22:04Z) - Efficient Modelling Across Time of Human Actions and Interactions [92.39082696657874]
3つの畳み込みニューラルネットワーク(CNND)における現在の固定サイズの時間的カーネルは、入力の時間的変動に対処するために改善できると主張している。
我々は、アーキテクチャの異なるレイヤにまたがる機能の違いを強化することで、アクションのクラス間でどのようにうまく対処できるかを研究する。
提案手法は、いくつかのベンチマークアクション認識データセットで評価され、競合する結果を示す。
論文 参考訳(メタデータ) (2021-10-05T15:39:11Z) - Improving Skeleton-based Action Recognitionwith Robust Spatial and
Temporal Features [6.548580592686076]
空間と時間におけるより堅牢な識別的特徴を学習するための新しいメカニズムを提案する。
これらの頑健な特徴を学習し、使用することにより、動作認識精度を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-08-01T19:29:53Z) - Neuromodulated Neural Architectures with Local Error Signals for
Memory-Constrained Online Continual Learning [4.2903672492917755]
我々は,局所学習とニューロ変調を取り入れた,生物学的にインスパイアされた軽量ニューラルネットワークアーキテクチャを開発した。
一つの課題と連続的な学習環境の両方にアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-07-16T07:41:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。