論文の概要: Hy-Facial: Hybrid Feature Extraction by Dimensionality Reduction Methods for Enhanced Facial Expression Classification
- arxiv url: http://arxiv.org/abs/2509.26614v1
- Date: Tue, 30 Sep 2025 17:53:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.238579
- Title: Hy-Facial: Hybrid Feature Extraction by Dimensionality Reduction Methods for Enhanced Facial Expression Classification
- Title(参考訳): 表情の強調分類のための次元化法によるハイファシアルハイブリッド特徴抽出
- Authors: Xinjin Li, Yu Ma, Kaisen Ye, Jinghan Cao, Minghao Zhou, Yeyang Zhou,
- Abstract要約: Hy-Facialは、ディープラーニングと従来の画像処理技術を統合したハイブリッド機能抽出フレームワークである。
提案手法は,Visual Geometry Group 19-layer network (VGG19) から抽出した深い特徴と手作りの局所記述子を融合する。
- 参考スコア(独自算出の注目度): 2.4035294971851364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial expression classification remains a challenging task due to the high dimensionality and inherent complexity of facial image data. This paper presents Hy-Facial, a hybrid feature extraction framework that integrates both deep learning and traditional image processing techniques, complemented by a systematic investigation of dimensionality reduction strategies. The proposed method fuses deep features extracted from the Visual Geometry Group 19-layer network (VGG19) with handcrafted local descriptors and the scale-invariant feature transform (SIFT) and Oriented FAST and Rotated BRIEF (ORB) algorithms, to obtain rich and diverse image representations. To mitigate feature redundancy and reduce computational complexity, we conduct a comprehensive evaluation of dimensionality reduction techniques and feature extraction. Among these, UMAP is identified as the most effective, preserving both local and global structures of the high-dimensional feature space. The Hy-Facial pipeline integrated VGG19, SIFT, and ORB for feature extraction, followed by K-means clustering and UMAP for dimensionality reduction, resulting in a classification accuracy of 83. 3\% in the facial expression recognition (FER) dataset. These findings underscore the pivotal role of dimensionality reduction not only as a pre-processing step but as an essential component in improving feature quality and overall classification performance.
- Abstract(参考訳): 表情の分類は、顔画像データの高次元性や固有の複雑さのため、依然として困難な課題である。
本稿では,ディープラーニングと従来の画像処理技術を統合したハイブリッドな特徴抽出フレームワークHy-Facialについて述べる。
提案手法は,Visual Geometry Group 19層ネットワーク(VGG19)から抽出した深い特徴を手作りローカル記述子とスケール不変特徴変換(SIFT)とオブジェクト指向FASTおよび回転BRIEF(ORB)アルゴリズムで融合し,リッチで多様な画像表現を得る。
特徴の冗長性を軽減し,計算複雑性を低減するため,次元削減技術と特徴抽出の総合的な評価を行う。
これらのうち、UMAPは最も効果的であり、高次元特徴空間の局所構造と大域構造の両方を保存している。
Hy-Facialパイプラインは,特徴抽出のためにVGG19,SIFT,ORBを統合した。
3\%であった。
これらの知見は,前処理段階だけでなく,特徴量の改善と全体的な分類性能向上に欠かせない要素として,次元減少の重要さを浮き彫りにしている。
関連論文リスト
- Hybrid Feature Collaborative Reconstruction Network for Few-Shot Fine-Grained Image Classification [6.090855292102877]
画像分類のためのHFCR-Net(Hybrid Feature Collaborative Restruction Network)を設計する。
チャネルの特徴と空間的特徴を融合させ,クラス間差を増大させる。
広範に使われている3つのきめ細かいデータセットに対する実験は、我々のアプローチの有効性と優位性を示している。
論文 参考訳(メタデータ) (2024-07-02T10:14:00Z) - DCN-T: Dual Context Network with Transformer for Hyperspectral Image
Classification [109.09061514799413]
複雑な撮像条件による空間変動のため,HSI分類は困難である。
本稿では,HSIを高品質な三スペクトル画像に変換する三スペクトル画像生成パイプラインを提案する。
提案手法は,HSI分類における最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-04-19T18:32:52Z) - ATASI-Net: An Efficient Sparse Reconstruction Network for Tomographic
SAR Imaging with Adaptive Threshold [13.379416816598873]
本稿では,解析的反復収縮しきい値決定アルゴリズム(ALISTA)に基づく,効率的なスパース展開ネットワークを提案する。
ATASI-Netの各層における重み行列は、オフライン最適化問題の解法として事前計算される。
さらに、各方位領域画素に対して適応しきい値を導入し、しきい値収縮を層蒸着だけでなく素子的にも可能とする。
論文 参考訳(メタデータ) (2022-11-30T09:55:45Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Multi-Margin based Decorrelation Learning for Heterogeneous Face
Recognition [90.26023388850771]
本稿では,超球面空間におけるデコリレーション表現を抽出するディープニューラルネットワーク手法を提案する。
提案するフレームワークは,不均一表現ネットワークとデコリレーション表現学習の2つのコンポーネントに分けることができる。
2つの難解な異種顔データベースに対する実験結果から,本手法は検証タスクと認識タスクの両方において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-05-25T07:01:12Z) - Feature Super-Resolution Based Facial Expression Recognition for
Multi-scale Low-Resolution Faces [7.634398926381845]
超解像法はしばしば低分解能画像の高精細化に使用されるが、FERタスクの性能は極低分解能画像では制限される。
本研究では,物体検出のための特徴的超解像法に触発されて,頑健な表情認識のための新たな生成逆ネットワークに基づく超解像法を提案する。
論文 参考訳(メタデータ) (2020-04-05T15:38:47Z) - SD-GAN: Structural and Denoising GAN reveals facial parts under
occlusion [7.284661356980246]
咬合状態にある顔の欠損部分を再構成する生成モデルを提案する。
GAN(Generative Adversarial Network)モデルとして,2モーダルな相互排他的学習アルゴリズムを考案した。
提案手法は,顔認識の性能向上においても,競合する手法よりもかなり優れている。
論文 参考訳(メタデータ) (2020-02-19T21:12:49Z) - Hybrid Embedded Deep Stacked Sparse Autoencoder with w_LPPD SVM Ensemble [13.981652331491558]
本稿では,新しいディープオートエンコーダについて述べる。
トレーニング中にオリジナルの機能を埋め込んで、弱い隠蔽層出力をフィルタリングすることで、差別的な深い特徴を学習することができる。
実験の結果,提案した特徴学習法は,他の既存および最先端の特徴学習アルゴリズムと比較して,優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2020-02-17T04:06:05Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。