論文の概要: BReG-NeXt: Facial Affect Computing Using Adaptive Residual Networks With
Bounded Gradient
- arxiv url: http://arxiv.org/abs/2004.08495v1
- Date: Sat, 18 Apr 2020 00:26:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 05:28:19.376210
- Title: BReG-NeXt: Facial Affect Computing Using Adaptive Residual Networks With
Bounded Gradient
- Title(参考訳): BReG-NeXt: 境界勾配を持つ適応残差ネットワークを用いた顔影響計算
- Authors: Behzad Hasani, Pooran Singh Negi, Mohammad H. Mahoor
- Abstract要約: 本稿では,単純なショートカットパスの代わりに関数wtih境界微分を用いた残差ベースネットワークアーキテクチャであるBReG-NeXtを紹介する。
ResNetと比較して、我々の提案した適応的複素写像は、訓練パラメータの少ない浅いネットワークと1秒あたりの浮動小数点演算(FLOP)で得られる。
我々は,AffectNet,FER2013,Affect-in-Wildの難易度データベースに影響を及ぼすカテゴリモデルと次元モデルに関する総合的な実験を行った。
- 参考スコア(独自算出の注目度): 4.41738804598711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces BReG-NeXt, a residual-based network architecture using
a function wtih bounded derivative instead of a simple shortcut path (a.k.a.
identity mapping) in the residual units for automatic recognition of facial
expressions based on the categorical and dimensional models of affect. Compared
to ResNet, our proposed adaptive complex mapping results in a shallower network
with less numbers of training parameters and floating point operations per
second (FLOPs). Adding trainable parameters to the bypass function further
improves fitting and training the network and hence recognizing subtle facial
expressions such as contempt with a higher accuracy. We conducted comprehensive
experiments on the categorical and dimensional models of affect on the
challenging in-the-wild databases of AffectNet, FER2013, and Affect-in-Wild.
Our experimental results show that our adaptive complex mapping approach
outperforms the original ResNet consisting of a simple identity mapping as well
as other state-of-the-art methods for Facial Expression Recognition (FER).
Various metrics are reported in both affect models to provide a comprehensive
evaluation of our method. In the categorical model, BReG-NeXt-50 with only 3.1M
training parameters and 15 MFLOPs, achieves 68.50% and 71.53% accuracy on
AffectNet and FER2013 databases, respectively. In the dimensional model,
BReG-NeXt achieves 0.2577 and 0.2882 RMSE value on AffectNet and Affect-in-Wild
databases, respectively.
- Abstract(参考訳): 本稿では,BReG-NeXtについて述べる。BReG-NeXtは,感情のカテゴリーモデルと次元モデルに基づく表情の自動認識のための,単純なショートカットパス(アイデンティティマッピング)の代わりに関数wtih境界微分を用いた残差ネットワークアーキテクチャである。
resnetと比較して,提案する適応型複雑なマッピングは,より少ないトレーニングパラメータと浮動小数点演算(flops)を持つ,より浅いネットワークを実現する。
バイパス機能にトレーニング可能なパラメータを追加することで、ネットワークの適合性とトレーニングがさらに向上し、より高精度で軽蔑などの微妙な表情を認識する。
我々は,AffectNet,FER2013,Affect-in-Wildの難易度データベースに影響を及ぼすカテゴリモデルと次元モデルに関する総合的な実験を行った。
実験結果から,我々の適応的複雑マッピング手法は,顔の表情認識(FER)のための他の最先端手法と同様に,単純なアイデンティティマッピングを含む元のResNetよりも優れていることがわかった。
本手法の総合評価を行うために,両モデルに様々な指標が報告されている。
カテゴリモデルでは、3.1mのトレーニングパラメータと15mflopsのbreg-next-50がそれぞれ68.50%と71.53%の精度を達成している。
次元モデルでは、BReG-NeXtはAffectNetとAffect-in-Wildデータベース上でそれぞれ0.2577と0.2882のRMSE値を達成する。
関連論文リスト
- PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは,ポイントマスク自動エンコーダのグローバルな特徴表現を強化する,自己教師型学習フレームワークである。
PseudoNeg-MAE は ModelNet40 と ScanObjectNN のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - MPruner: Optimizing Neural Network Size with CKA-Based Mutual Information Pruning [7.262751938473306]
プルーニング(Pruning)は、ニューラルネットワークのサイズを減らし、数学的に精度の保存を保証している、よく確立されたテクニックである。
我々は,ベクトル類似性により相互情報を活用する新しいプルーニングアルゴリズムMPrunerを開発した。
MPrunerはCNNとトランスフォーマーベースのモデルで最大50%のパラメータとメモリ使用量の削減を実現した。
論文 参考訳(メタデータ) (2024-08-24T05:54:47Z) - Just How Flexible are Neural Networks in Practice? [89.80474583606242]
ニューラルネットワークは、パラメータを持つ少なくとも多くのサンプルを含むトレーニングセットに適合できると広く信じられている。
しかし実際には、勾配や正規化子など、柔軟性を制限したトレーニング手順によるソリューションしか見つからない。
論文 参考訳(メタデータ) (2024-06-17T12:24:45Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - Prompt Tuning for Parameter-efficient Medical Image Segmentation [79.09285179181225]
2つの医用画像データセットのセマンティックセグメンテーションにパラメータ効率が良いが効果的な適応を実現するために,いくつかのコントリビューションを提案し,検討する。
我々はこのアーキテクチャを、オンライン生成プロトタイプへの割り当てに基づく専用密集型セルフスーパービジョンスキームで事前訓練する。
得られたニューラルネットワークモデルにより、完全に微調整されたモデルとパラメータに適応したモデルとのギャップを緩和できることを実証する。
論文 参考訳(メタデータ) (2022-11-16T21:55:05Z) - Adaptive Graph-Based Feature Normalization for Facial Expression
Recognition [1.2246649738388389]
データ不確実性から表情認識モデルを保護するために,適応グラフに基づく特徴正規化(AGFN)手法を提案する。
我々の手法は、ベンチマークデータセットで91.84%、91.11%の精度で最先端の作業より優れています。
論文 参考訳(メタデータ) (2022-07-22T14:57:56Z) - Facial expression and attributes recognition based on multi-task
learning of lightweight neural networks [9.162936410696409]
顔の識別と顔の属性の分類のための軽量畳み込みニューラルネットワークのマルチタスクトレーニングを検討する。
顔の表情を予測するためには,これらのネットワークを微調整する必要がある。
MobileNet、EfficientNet、RexNetアーキテクチャに基づくいくつかのモデルが提示される。
論文 参考訳(メタデータ) (2021-03-31T14:21:04Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。