論文の概要: Which CNNs and Training Settings to Choose for Action Unit Detection? A
Study Based on a Large-Scale Dataset
- arxiv url: http://arxiv.org/abs/2111.08320v1
- Date: Tue, 16 Nov 2021 09:28:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 15:04:24.338257
- Title: Which CNNs and Training Settings to Choose for Action Unit Detection? A
Study Based on a Large-Scale Dataset
- Title(参考訳): アクションユニット検出のために選択すべきcnnとトレーニング設定は?
大規模データセットに基づく一考察
- Authors: Mina Bishay, Ahmed Ghoneim, Mohamed Ashraf and Mohammad Mavadati
- Abstract要約: AU(Action Unit)検出では,10種類の浅いCNNと深いCNNを比較した。
第2に、異なるトレーニング設定(例えば、入力の集中/正規化、異なる拡張精度の使用、データのバランス)がAU検出の性能に与える影響について検討する。
第3に、トレーニングセットにおけるラベル付き被検体とフレームの数がAU検出性能に与える影響について検討する。
- 参考スコア(独自算出の注目度): 3.2575001434344286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we explore the influence of some frequently used Convolutional
Neural Networks (CNNs), training settings, and training set structures, on
Action Unit (AU) detection. Specifically, we first compare 10 different shallow
and deep CNNs in AU detection. Second, we investigate how the different
training settings (i.e. centering/normalizing the inputs, using different
augmentation severities, and balancing the data) impact the performance in AU
detection. Third, we explore the effect of increasing the number of labelled
subjects and frames in the training set on the AU detection performance. These
comparisons provide the research community with useful tips about the choice of
different CNNs and training settings in AU detection. In our analysis, we use a
large-scale naturalistic dataset, consisting of ~55K videos captured in the
wild. To the best of our knowledge, there is no work that had investigated the
impact of such settings on a large-scale AU dataset.
- Abstract(参考訳): 本稿では,よく使用される畳み込みニューラルネットワーク(cnns),トレーニング設定,トレーニングセット構造が行動単位(au)検出に与える影響について検討する。
具体的には、au検出においてまず10種類の浅層と深層cnnを比較した。
第2に、異なるトレーニング設定(例えば、入力の集中/正規化、異なる拡張精度の使用、データのバランス)がAU検出の性能に与える影響について検討する。
第3に,au検出性能に及ぼす学習セットのラベル付き被写体数とフレーム数の増加の影響について検討する。
これらの比較は、異なるCNNの選択とAU検出のトレーニング設定に関する有用なヒントを提供する。
分析では、野生で撮影された約55Kのビデオからなる大規模な自然主義的データセットを使用します。
我々の知る限りでは、そのような設定が大規模AUデータセットに与える影響を調査した研究は存在しない。
関連論文リスト
- ALBench: A Framework for Evaluating Active Learning in Object Detection [102.81795062493536]
本稿では、オブジェクト検出におけるアクティブラーニングを評価するために、ALBenchという名前のアクティブラーニングベンチマークフレームワークをコントリビュートする。
自動深層モデルトレーニングシステム上で開発されたこのALBenchフレームワークは、使いやすく、さまざまなアクティブな学習アルゴリズムと互換性があり、同じトレーニングおよびテストプロトコルを保証する。
論文 参考訳(メタデータ) (2022-07-27T07:46:23Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Network Comparison Study of Deep Activation Feature Discriminability
with Novel Objects [0.5076419064097732]
最先端のコンピュータビジョンアルゴリズムは、Deep Neural Networks(DNN)を特徴抽出に取り入れ、Deep Convolutional Activation Features(DeCAF)を作成する。
本研究では、6つの主要な視覚認識DNNアーキテクチャのDeCAF空間に符号化された新しい物体の視覚的外観の一般的な識別可能性について分析する。
論文 参考訳(メタデータ) (2022-02-08T07:40:53Z) - Multi-Domain Joint Training for Person Re-Identification [51.73921349603597]
ReID(Deep Learning-based person Re-IDentification)は、優れたパフォーマンスを達成するために、大量のトレーニングデータを必要とすることが多い。
多様な環境からより多くのトレーニングデータを集めることで、ReIDのパフォーマンスが向上する傾向にある。
本稿では,パラメータを様々な要因に適応させることができる,Domain-Camera-Sample Dynamic Network (DCSD) というアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-06T09:20:59Z) - Choose Settings Carefully: Comparing Action Unit detection at Different
Settings Using a Large-Scale Dataset [3.2575001434344286]
本稿では,顔画像の前処理によく使用される設定が,AU検出性能と複雑性に与える影響について検討する。
調査では、商業広告を見る参加者のために、野生で収集された55Kのビデオからなる大規模なデータセットを使用します。
論文 参考訳(メタデータ) (2021-11-16T09:44:41Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - Receptive Field Regularization Techniques for Audio Classification and
Tagging with Deep Convolutional Neural Networks [7.9495796547433395]
CNNの受容場(RF)のチューニングは,その一般化に不可欠であることを示す。
我々は,CNNのRFを制御し,結果のアーキテクチャを体系的にテストする,いくつかの系統的なアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-26T08:36:29Z) - Object Localization Through a Single Multiple-Model Convolutional Neural
Network with a Specific Training Approach [0.0]
光畳み込みニューラルネットワーク(cnn)に対して,画像に対する関心領域を決定するための特別訓練手法を提案する。
ほぼ全てのCNNベースの検出器は、固定された入力サイズ画像を使用し、様々なオブジェクトサイズを扱う場合、性能が低下する可能性がある。
論文 参考訳(メタデータ) (2021-03-24T16:52:01Z) - Decoding CNN based Object Classifier Using Visualization [6.666597301197889]
CNNのさまざまな畳み込み層で抽出される特徴の種類を視覚化する。
アクティベーションのヒートマップを可視化することは、CNNが画像内の異なるオブジェクトを分類し、ローカライズする方法を理解するのに役立ちます。
論文 参考訳(メタデータ) (2020-07-15T05:01:27Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z) - Hold me tight! Influence of discriminative features on deep network
boundaries [63.627760598441796]
本稿では,データセットの特徴と,サンプルから決定境界までの距離を関連付ける新しい視点を提案する。
これにより、トレーニングサンプルの位置を慎重に調整し、大規模ビジョンデータセットでトレーニングされたCNNの境界における誘発された変化を測定することができる。
論文 参考訳(メタデータ) (2020-02-15T09:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。