論文の概要: FAR-AMTN: Attention Multi-Task Network for Face Attribute Recognition
- arxiv url: http://arxiv.org/abs/2601.01537v1
- Date: Sun, 04 Jan 2026 14:20:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.471107
- Title: FAR-AMTN: Attention Multi-Task Network for Face Attribute Recognition
- Title(参考訳): FAR-AMTN:顔属性認識のための注意型マルチタスクネットワーク
- Authors: Gong Gao, Zekai Wang, Xianhui Liu, Weidong Zhao,
- Abstract要約: 本研究では,顔属性認識のための新しいマルチタスクネットワークであるFAR-AMTNを紹介する。
Weight-Shared Group-Specific Attention (WSGSA)モジュールが組み込まれている。
CelebAとLFWAデータセットの実験では、提案されたFAR-AMTNは既存のモデルに比べてパラメータが大幅に少ないため、精度が優れていることが示されている。
- 参考スコア(独自算出の注目度): 13.392837372242907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To enhance the generalization performance of Multi-Task Networks (MTN) in Face Attribute Recognition (FAR), it is crucial to share relevant information across multiple related prediction tasks effectively. Traditional MTN methods create shared low-level modules and distinct high-level modules, causing an exponential increase in model parameters with the addition of tasks. This approach also limits feature interaction at the high level, hindering the exploration of semantic relations among attributes, thereby affecting generalization negatively. In response, this study introduces FAR-AMTN, a novel Attention Multi-Task Network for FAR. It incorporates a Weight-Shared Group-Specific Attention (WSGSA) module with shared parameters to minimize complexity while improving group feature representation. Furthermore, a Cross-Group Feature Fusion (CGFF) module is utilized to foster interactions between attribute groups, enhancing feature learning. A Dynamic Weighting Strategy (DWS) is also introduced for synchronized task convergence. Experiments on the CelebA and LFWA datasets demonstrate that the proposed FAR-AMTN demonstrates superior accuracy with significantly fewer parameters compared to existing models.
- Abstract(参考訳): 顔属性認識(FAR)におけるマルチタスクネットワーク(MTN)の一般化性能を高めるためには、複数の関連する予測タスク間で関連情報を効果的に共有することが重要である。
従来のMTN法は、共有低レベルモジュールと異なる高レベルモジュールを作成し、タスクの追加によってモデルパラメータが指数関数的に増加する。
このアプローチは、属性間の意味的関係の探索を妨げるため、高いレベルでの特徴的相互作用も制限し、それによって一般化に悪影響を及ぼす。
そこで本研究では,FARのための新しいマルチタスクネットワークであるFAR-AMTNを紹介する。
Weight-Shared Group-Specific Attention (WSGSA)モジュールが組み込まれている。
さらに、Cross-Group Feature Fusion (CGFF)モジュールを使用して、属性グループ間の相互作用を促進し、特徴学習を強化する。
同期タスク収束のための動的重み付け戦略(DWS)も導入されている。
CelebAとLFWAデータセットの実験では、提案されたFAR-AMTNは既存のモデルに比べてパラメータが大幅に少ないため、精度が優れていることが示されている。
関連論文リスト
- FAIM: Frequency-Aware Interactive Mamba for Time Series Classification [87.84511960413715]
時系列分類(TSC)は、環境モニタリング、診断、姿勢認識など、多くの実世界の応用において重要である。
本稿では,周波数対応対話型マンバモデルであるFAIMを提案する。
FAIMは既存の最先端(SOTA)手法を一貫して上回り、精度と効率のトレードオフが優れていることを示す。
論文 参考訳(メタデータ) (2025-11-26T08:36:33Z) - Group Relative Augmentation for Data Efficient Action Detection [11.169883977958454]
アクション検出にVLM(Big Video-Language Models)を適応させるには、いくつかの例が課題となっている。
パラメータ係数チューニング(LoRA)と新たな学習可能な内部特徴拡張を組み合わせた効率的な適応戦略を提案する。
複雑なマルチラベル・マルチパーソン動作検出データセットに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2025-07-28T21:46:05Z) - MPT-PAR:Mix-Parameters Transformer for Panoramic Activity Recognition [2.1794550051087995]
本稿では,各タスクのユニークな特徴と異なるタスク間の相乗効果を同時に考慮したMPT-PARモデルを提案する。
提案手法は,JRDB-PARデータセットの粒度とF1総合スコアを47.5%とした。
論文 参考訳(メタデータ) (2024-08-01T09:42:44Z) - PARFormer: Transformer-based Multi-Task Network for Pedestrian Attribute
Recognition [23.814762073093153]
4つのモジュールを含むPARFormerという,純粋なトランスフォーマーベースのマルチタスクPARネットワークを提案する。
特徴抽出モジュールでは,特徴抽出のための強力なベースラインを構築し,複数のPARベンチマークで競合する結果を得る。
視点認識モジュールでは、歩行者属性に対する視点の影響を探索し、マルチビューのコントラスト損失を提案する。
属性認識モジュールでは、負の正の不均衡問題を緩和し、属性予測を生成する。
論文 参考訳(メタデータ) (2023-04-14T16:27:56Z) - Multi-task Over-the-Air Federated Learning: A Non-Orthogonal
Transmission Approach [52.85647632037537]
複数の学習タスクがエッジサーバ(ES)の協調の下でデータ収集および学習モデルのためのエッジデバイスを共有するマルチタスク・オーバーテア・フェデレーション・ラーニング(MOAFL)フレームワークを提案する。
収束解析と数値計算の両方の結果から,MOAFLフレームワークは学習性能を著しく低下させることなく,複数のタスクのアップリンク帯域幅の消費を大幅に削減できることが示された。
論文 参考訳(メタデータ) (2021-06-27T13:09:32Z) - Task-Feature Collaborative Learning with Application to Personalized
Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。
具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。
実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文 参考訳(メタデータ) (2020-04-29T02:32:04Z) - Multi-Granularity Reference-Aided Attentive Feature Aggregation for
Video-based Person Re-identification [98.7585431239291]
ビデオベースの人物再識別は、同じ人物をビデオクリップ間でマッチングすることを目的としている。
本稿では,マルチグラニュラリティ参照属性集約モジュールMG-RAFAを提案する。
本フレームワークは,3つのベンチマークデータセット上での最先端のアブレーション性能を実現する。
論文 参考訳(メタデータ) (2020-03-27T03:49:21Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。