論文の概要: Kernelized dense layers for facial expression recognition
- arxiv url: http://arxiv.org/abs/2009.10814v1
- Date: Tue, 22 Sep 2020 21:02:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 22:42:16.749008
- Title: Kernelized dense layers for facial expression recognition
- Title(参考訳): 顔表情認識のための粒密層
- Authors: M.Amine Mahmoudi, Aladine Chetouani, Fatma Boufera and Hedi Tabia
- Abstract要約: 本稿では,従来の線形関係ではなく,高次特徴相互作用をキャプチャするカーネル化Dense Layer (KDL)を提案する。
本モデルでは,最先端のアプローチに関して,競争力のある結果が得られることを示す。
- 参考スコア(独自算出の注目度): 10.98068123467568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fully connected layer is an essential component of Convolutional Neural
Networks (CNNs), which demonstrates its efficiency in computer vision tasks.
The CNN process usually starts with convolution and pooling layers that first
break down the input images into features, and then analyze them independently.
The result of this process feeds into a fully connected neural network
structure which drives the final classification decision. In this paper, we
propose a Kernelized Dense Layer (KDL) which captures higher order feature
interactions instead of conventional linear relations. We apply this method to
Facial Expression Recognition (FER) and evaluate its performance on RAF,
FER2013 and ExpW datasets. The experimental results demonstrate the benefits of
such layer and show that our model achieves competitive results with respect to
the state-of-the-art approaches.
- Abstract(参考訳): 完全な接続層は畳み込みニューラルネットワーク(CNN)の重要なコンポーネントであり、コンピュータビジョンタスクにおける効率性を示す。
CNNプロセスは通常、畳み込み層とプール層から始まり、まず入力イメージを機能に分解し、それから独立して解析する。
このプロセスの結果は、最終分類決定を駆動する完全に接続されたニューラルネットワーク構造に入力される。
本稿では,従来の線形関係ではなく,高次特徴的相互作用を捉えたkdl(kernelized dense layer)を提案する。
本手法を顔表情認識(FER)に適用し,RAF,FER2013,ExpWデータセット上での性能評価を行う。
実験結果は,このような層の利点を実証し,最先端のアプローチに関して,我々のモデルが競争力のある結果を得ることを示す。
関連論文リスト
- Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Enhancing Kinship Verification through Multiscale Retinex and Combined
Deep-Shallow features [2.829220962949294]
本研究では,Multiscale Retinex (MSR) という,画像品質を向上しコントラストを増大させる前処理手法を統合する。
深い特徴抽出のために、畳み込みニューラルネットワークで事前訓練されたVGG16モデルの長所に目を向ける。
本手法のロバスト性および有効性は、3つの厳密な親和性データセットの綿密な実験により検証された。
論文 参考訳(メタデータ) (2023-12-06T15:52:31Z) - ASU-CNN: An Efficient Deep Architecture for Image Classification and
Feature Visualizations [0.0]
活性化関数はディープニューラルネットワークの能力を決定する上で決定的な役割を果たす。
本稿では,ASU-CNNと呼ばれる畳み込みニューラルネットワークモデルを提案する。
ネットワークは、CIFAR-10の分類のためのトレーニングデータとテストデータの両方において有望な結果を得た。
論文 参考訳(メタデータ) (2023-05-28T16:52:25Z) - Kernel function impact on convolutional neural networks [10.98068123467568]
畳み込みニューラルネットワークの異なる層におけるカーネル関数の利用について検討する。
より歪みに敏感なプール層を導入することで、カーネル関数を効果的に活用する方法を示す。
完全接続層を置き換えるKDL(Kernelized Dense Layers)を提案する。
論文 参考訳(メタデータ) (2023-02-20T19:57:01Z) - Pushing the Efficiency Limit Using Structured Sparse Convolutions [82.31130122200578]
本稿では,画像の固有構造を利用して畳み込みフィルタのパラメータを削減する構造的スパース畳み込み(SSC)を提案する。
我々は、SSCが効率的なアーキテクチャにおける一般的なレイヤ(奥行き、グループ回り、ポイント回りの畳み込み)の一般化であることを示す。
SSCに基づくアーキテクチャは、CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet分類ベンチマークのベースラインと比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-23T18:37:22Z) - Insights on Neural Representations for End-to-End Speech Recognition [28.833851817220616]
エンドツーエンド自動音声認識(ASR)モデルは、一般化された音声表現を学習することを目的としている。
相関解析手法を用いたネットワーク類似性の調査は、エンド・ツー・エンドASRモデルでは行われていない。
本稿では,CNN,LSTM,Transformerをベースとしたトレーニングにおいて,レイヤ間の内部ダイナミクスを解析し,検討する。
論文 参考訳(メタデータ) (2022-05-19T10:19:32Z) - Deep Architecture Connectivity Matters for Its Convergence: A
Fine-Grained Analysis [94.64007376939735]
我々は、勾配降下訓練におけるディープニューラルネットワーク(DNN)の収束に対する接続パターンの影響を理論的に特徴づける。
接続パターンの単純なフィルタリングによって、評価対象のモデルの数を削減できることが示される。
論文 参考訳(メタデータ) (2022-05-11T17:43:54Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Video-based Facial Expression Recognition using Graph Convolutional
Networks [57.980827038988735]
我々は、ビデオベースの表情認識のための共通のCNN-RNNモデルに、GCN(Graph Convolutional Network)層を導入する。
我々は、CK+、Oulu-CASIA、MMIの3つの広く使われているデータセットと、AFEW8.0の挑戦的なワイルドデータセットについて、本手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-26T07:31:51Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Towards Improved Human Action Recognition Using Convolutional Neural
Networks and Multimodal Fusion of Depth and Inertial Sensor Data [1.52292571922932]
本稿では,深度と慣性センサデータの融合によるヒューマンアクション認識(HAR)の精度向上を試みる。
我々は、深度データを逐次フロントビューイメージ(SFI)に変換し、これらの画像上でトレーニング済みのAlexNetを微調整する。
慣性データを信号画像(SI)に変換し、これらの画像上で別の畳み込みニューラルネットワーク(CNN)を訓練する。
論文 参考訳(メタデータ) (2020-08-22T03:41:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。