論文の概要: Non-Linearities Improve OrigiNet based on Active Imaging for Micro
Expression Recognition
- arxiv url: http://arxiv.org/abs/2005.07991v1
- Date: Sat, 16 May 2020 13:44:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 13:33:32.348754
- Title: Non-Linearities Improve OrigiNet based on Active Imaging for Micro
Expression Recognition
- Title(参考訳): マイクロ表現認識のための能動イメージングに基づく非線形性向上
- Authors: Monu Verma, Santosh Kumar Vipparthi, Girdhari Singh
- Abstract要約: ビデオの表現領域におけるアクティブな変化を1フレームに分離するために,能動画像の概念を導入する。
ビデオ中のマイクロ表現の重要な特徴を効率的に学習する,ハイブリッド局所受容場に基づく拡張現実ネットワーク(OrigiNet)を提案する。
- 参考スコア(独自算出の注目度): 8.112868317921853
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Micro expression recognition (MER)is a very challenging task as the
expression lives very short in nature and demands feature modeling with the
involvement of both spatial and temporal dynamics. Existing MER systems exploit
CNN networks to spot the significant features of minor muscle movements and
subtle changes. However, existing networks fail to establish a relationship
between spatial features of facial appearance and temporal variations of facial
dynamics. Thus, these networks were not able to effectively capture minute
variations and subtle changes in expressive regions. To address these issues,
we introduce an active imaging concept to segregate active changes in
expressive regions of a video into a single frame while preserving facial
appearance information. Moreover, we propose a shallow CNN network: hybrid
local receptive field based augmented learning network (OrigiNet) that
efficiently learns significant features of the micro-expressions in a video. In
this paper, we propose a new refined rectified linear unit (RReLU), which
overcome the problem of vanishing gradient and dying ReLU. RReLU extends the
range of derivatives as compared to existing activation functions. The RReLU
not only injects a nonlinearity but also captures the true edges by imposing
additive and multiplicative property. Furthermore, we present an augmented
feature learning block to improve the learning capabilities of the network by
embedding two parallel fully connected layers. The performance of proposed
OrigiNet is evaluated by conducting leave one subject out experiments on four
comprehensive ME datasets. The experimental results demonstrate that OrigiNet
outperformed state-of-the-art techniques with less computational complexity.
- Abstract(参考訳): マイクロ表現認識(MER)は非常に難しい課題であり、表現は自然界において非常に短く、空間力学と時間力学の両方の関与を伴う特徴モデリングを必要とする。
既存のmerシステムはcnnネットワークを利用して、小さな筋肉の動きと微妙な変化の重要な特徴を見つける。
しかし、既存のネットワークは、顔の外観の空間的特徴と顔のダイナミクスの時間的変動の関係を確立できない。
したがって、これらのネットワークは表現領域の微妙な変化や微妙な変化を効果的に捉えられなかった。
そこで本研究では,映像の表現領域のアクティブな変化を1つのフレームに分離し,顔の表情情報を保持するアクティブイメージング概念を提案する。
さらに,ビデオ中のマイクロ表現の重要な特徴を効率的に学習する,ハイブリッド局所受容場に基づく拡張現実ネットワーク(OrigiNet)を提案する。
本稿では, 勾配の消失とreluの消滅という問題を克服した, 改良された整流線形単位(rrelu)を提案する。
rreluは既存の活性化関数と比較して誘導体の範囲を広げる。
RReLUは非線形性を注入するだけでなく、加法的および乗法的性質を付与することによって真のエッジを捕捉する。
さらに,2つの並列完全連結層を埋め込むことにより,ネットワークの学習能力を向上させるための拡張機能学習ブロックを提案する。
提案するOrigiNetの性能は,4つの包括的MEデータセットに対して1つの被験者による実験を行うことで評価する。
実験の結果,OrigiNetは計算複雑性の低い最先端技術よりも優れていた。
関連論文リスト
- Three-Stream Temporal-Shift Attention Network Based on Self-Knowledge Distillation for Micro-Expression Recognition [21.675660978188617]
ミクロな表現認識は、犯罪分析や心理療法など、多くの分野で重要である。
本稿では,SKD-TSTSANと呼ばれる自己知識蒸留に基づく3ストリーム時間シフトアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2024-06-25T13:22:22Z) - Residual Connections Harm Generative Representation Learning [22.21222349477351]
残差ネットワークにおけるアイデンティティショートカットの影響を低減するために重み付け係数を導入することで、意味的特徴学習が大幅に向上することを示す。
VIT-B/16バックボーンを持つMAEのイメージネット精度は67.8%から72.7%に向上した。
論文 参考訳(メタデータ) (2024-04-16T23:05:17Z) - Multi-Scale Spatio-Temporal Graph Convolutional Network for Facial Expression Spotting [11.978551396144532]
表情スポッティングのためのマルチスケール時空間グラフコナーネットワーク(SpoT-CN)を提案する。
窓長がネットワークの時間的受容野に適応するコンパクトなスライディングウインドウにおいて,顔面筋の短期的および長期的運動を追跡する。
このネットワークは,提案した顔局所進化グラフプーリング(FLGP)を用いて,複数スケールの顔グラフ構造から局所的特徴と大域的特徴を学習する。
論文 参考訳(メタデータ) (2024-03-24T03:10:39Z) - Multiscale Low-Frequency Memory Network for Improved Feature Extraction
in Convolutional Neural Networks [13.815116154370834]
本稿では,Multiscale Low-Frequency Memory (MLFM) Networkを提案する。
MLFMは低周波情報を効率よく保存し、目標とするコンピュータビジョンタスクの性能を向上させる。
我々の研究は、既存のCNN基盤の上に構築され、コンピュータビジョンの今後の進歩の道を開く。
論文 参考訳(メタデータ) (2024-03-13T00:48:41Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - Towards Understanding the Effectiveness of Attention Mechanism [7.809333418199897]
特徴の注意重みとその重要性の間には、弱い一貫性しか存在しないことが分かっています。
フィーチャーマップの乗算によって高次非線形性がもたらされたため、CNNでは正規化の役割を担った。
本稿では,ResNetにおける特徴マップの追加を特徴マップ乗算に置き換えることで,特徴マップ乗算ネットワーク(FMMNet)を設計する。
論文 参考訳(メタデータ) (2021-06-29T02:58:59Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Video-based Facial Expression Recognition using Graph Convolutional
Networks [57.980827038988735]
我々は、ビデオベースの表情認識のための共通のCNN-RNNモデルに、GCN(Graph Convolutional Network)層を導入する。
我々は、CK+、Oulu-CASIA、MMIの3つの広く使われているデータセットと、AFEW8.0の挑戦的なワイルドデータセットについて、本手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-26T07:31:51Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Fully Convolutional Networks for Continuous Sign Language Recognition [83.85895472824221]
連続手話認識は、空間次元と時間次元の両方の学習を必要とする困難なタスクである。
本稿では,オンラインSLRのための完全畳み込みネットワーク (FCN) を提案し,弱い注釈付きビデオシーケンスから空間的特徴と時間的特徴を同時に学習する。
論文 参考訳(メタデータ) (2020-07-24T08:16:37Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。