Fugu-MT 論文翻訳(概要): Self-supervised Auxiliary Learning for Texture and Model-based Hybrid Robust and Fair Featuring in Face Analysis

論文の概要: Self-supervised Auxiliary Learning for Texture and Model-based Hybrid Robust and Fair Featuring in Face Analysis

arxiv url: http://arxiv.org/abs/2409.19582v1
Date: Sun, 29 Sep 2024 07:03:05 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-05 22:28:30.502860
Title: Self-supervised Auxiliary Learning for Texture and Model-based Hybrid Robust and Fair Featuring in Face Analysis
Title（参考訳）: テクスチャとモデルに基づくハイブリッドロバストのための自己教師付き補助学習と顔分析における公正な特徴
Authors: Shukesh Reddy, Nishit Poddar, Srijan Das, Abhijit Das,
Abstract要約: 我々は、テクスチャベースのローカル記述子を特徴モデリングにブレンドし、効率的な顔分析を行うための補助的なタスクとして、自己教師あり学習(SSL)を探求する。マスクオートエンコーダ(MAE)のSSLタスクを,局所パターンなどのテクスチャの特徴を再構築する補助タスクとして使用した。
参考スコア（独自算出の注目度）: 7.479920049311377
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this work, we explore Self-supervised Learning (SSL) as an auxiliary task to blend the texture-based local descriptors into feature modelling for efficient face analysis. Combining a primary task and a self-supervised auxiliary task is beneficial for robust representation. Therefore, we used the SSL task of mask auto-encoder (MAE) as an auxiliary task to reconstruct texture features such as local patterns along with the primary task for robust and unbiased face analysis. We experimented with our hypothesis on three major paradigms of face analysis: face attribute and face-based emotion analysis, and deepfake detection. Our experiment results exhibit that better feature representation can be gleaned from our proposed model for fair and bias-less face analysis.
Abstract（参考訳）: 本研究では,テクスチャベースの局所記述子を特徴モデリングにブレンドし,効率的な顔分析を行うための補助課題として,自己教師あり学習(SSL)について検討する。主タスクと自己監督型補助タスクを組み合わせることは、堅牢な表現に有用である。そこで我々は,マスクオートエンコーダ(MAE)のSSLタスクを,局所パターンなどのテクスチャの特徴を再構築する補助タスクとして使用した。顔属性と顔に基づく感情分析,深度検出という,顔分析の3つの主要なパラダイムを仮説として検討した。実験結果から,提案モデルからより優れた特徴表現を抽出し,不公平かつ偏りのない顔分析を行うことができた。

関連論文リスト

Learning an Ensemble Token from Task-driven Priors in Facial Analysis [1.4228349888743608]
本稿では,アンサンブルトークンを学習するための新しい手法であるET-Fuserを紹介する。本稿では,自己認識機構内でアンサンブルトークンを生成する,頑健な事前統一学習手法を提案する。以上の結果から,特徴表現に統計的に有意な改善が見られた。
論文参考訳（メタデータ） (2025-07-02T02:07:31Z)
Towards Fair and Robust Face Parsing for Generative AI: A Multi-Objective Approach [10.00430939898858]
顔解析における精度,公平性,堅牢性を最適化する多目的学習フレームワークを提案する。以上の結果から,公平性に配慮したセグメンテーションにより,顔生成におけるフォトリアリズムと一貫性が向上することが示唆された。以上の結果から,多目的顔解析が人口動態の整合性や頑健性を改善し,高品質なGAN合成を実現することが示唆された。
論文参考訳（メタデータ） (2025-02-06T00:41:35Z)
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning [27.34249750803211]
実顔画像の基本表現を学習するための自己教師付き事前学習フレームワークを提案する。我々のモデルは、教師付き事前学習、視覚的および顔的自己指導型学習技術よりも優れており、タスク特化SOTA法よりも優れています。
論文参考訳（メタデータ） (2024-12-16T17:58:45Z)
UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文参考訳（メタデータ） (2024-07-26T20:51:54Z)
Task-adaptive Q-Face [75.15668556061772]
本稿では,タスク適応型マルチタスク顔分析手法Q-Faceを提案する。 Q-Faceは統合されたモデルで複数の顔分析タスクを同時に実行する。本手法は,顔表情認識,行動単位検出,顔属性分析,年齢推定,顔ポーズ推定における最先端性能を実現する。
論文参考訳（メタデータ） (2024-05-15T03:13:11Z)
FaceXFormer: A Unified Transformer for Facial Analysis [59.94066615853198]
FaceXformerは、さまざまな顔分析タスクのためのエンドツーエンドの統一トランスフォーマーモデルである。本モデルでは,8つのタスクにまたがる頑健さと一般化性を実証し,画像の「夢中」を効果的に処理する。
論文参考訳（メタデータ） (2024-03-19T17:58:04Z)
Faceptor: A Generalist Model for Face Perception [52.8066001012464]
Faceptorは、よく設計されたシングルエンコーダのデュアルデコーダアーキテクチャを採用するために提案されている。 Faceptorへのレイヤアテンションにより、モデルが最適なレイヤから機能を適応的に選択して、望ましいタスクを実行することができる。我々のトレーニングフレームワークは補助的な教師付き学習にも適用でき、年齢推定や表現認識といったデータスパースタスクの性能を大幅に向上させることができる。
論文参考訳（メタデータ） (2024-03-14T15:42:31Z)
General Facial Representation Learning in a Visual-Linguistic Manner [45.92447707178299]
本稿では,一般の顔表現学習を視覚言語的に行うためのフレームワークFaRLを紹介する。従来の事前学習モデルと比較して, FaRL は転送性能がよいことを示す。本モデルは,顔解析や顔のアライメントといった顔解析タスクにおける最先端の手法を超越したモデルである。
論文参考訳（メタデータ） (2021-12-06T15:22:05Z)
Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文参考訳（メタデータ） (2021-06-15T03:10:17Z)
MAFER: a Multi-resolution Approach to Facial Expression Recognition [9.878384185493623]
そこで本稿では,表情認識に携わる深層学習モデルを訓練するための2段階学習手法であるMAFERを提案する。 MAFERの関連する特徴は、タスクに依存しない、すなわち、他の客観的関連技術に補完的に使用できることである。
論文参考訳（メタデータ） (2021-05-06T07:26:58Z)
InterFaceGAN: Interpreting the Disentangled Face Representation Learned by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文参考訳（メタデータ） (2020-05-18T18:01:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。