論文の概要: Few-Shot Model Adaptation for Customized Facial Landmark Detection,
Segmentation, Stylization and Shadow Removal
- arxiv url: http://arxiv.org/abs/2104.09457v1
- Date: Mon, 19 Apr 2021 17:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 13:45:52.425647
- Title: Few-Shot Model Adaptation for Customized Facial Landmark Detection,
Segmentation, Stylization and Shadow Removal
- Title(参考訳): 顔のランドマーク検出、セグメンテーション、スタイライゼーション、シャドー除去をカスタマイズしたマイナショットモデル適応
- Authors: Zhen Wei, Bingkun Liu, Weinong Wang, Yu-Wing Tai
- Abstract要約: Few-Shot Model Adaptation (FSMA)フレームワークを提案し、Faces上のいくつかの重要なタスクでその可能性を実証する。
FSMAはまず、大規模なラベルなしデータを使用して対向自動エンコーダを訓練することによって、堅牢な顔画像埋め込みを取得する。
特徴適応と融合層を備えており、最小限のアノテート画像を用いて目的のタスクに効率的に適応する。
- 参考スコア(独自算出の注目度): 46.69915243199898
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite excellent progress has been made, the performance of deep learning
based algorithms still heavily rely on specific datasets, which are difficult
to extend due to labor-intensive labeling. Moreover, because of the advancement
of new applications, initial definition of data annotations might not always
meet the requirements of new functionalities. Thus, there is always a great
demand in customized data annotations. To address the above issues, we propose
the Few-Shot Model Adaptation (FSMA) framework and demonstrate its potential on
several important tasks on Faces. The FSMA first acquires robust facial image
embeddings by training an adversarial auto-encoder using large-scale unlabeled
data. Then the model is equipped with feature adaptation and fusion layers, and
adapts to the target task efficiently using a minimal amount of annotated
images. The FSMA framework is prominent in its versatility across a wide range
of facial image applications. The FSMA achieves state-of-the-art few-shot
landmark detection performance and it offers satisfying solutions for few-shot
face segmentation, stylization and facial shadow removal tasks for the first
time.
- Abstract(参考訳): 優れた進歩にもかかわらず、ディープラーニングベースのアルゴリズムのパフォーマンスは、労働集約的なラベル付けのために拡張が難しい特定のデータセットに大きく依存している。
さらに、新しいアプリケーションの発展により、データアノテーションの初期定義は必ずしも新しい機能要件を満たすとは限らない。
したがって、カスタマイズされたデータアノテーションには、常に大きな需要があります。
上記の問題に対処するため、Few-Shot Model Adaptation (FSMA)フレームワークを提案し、Faces上のいくつかの重要なタスクにおいてその可能性を示す。
FSMAは、まず、大規模な未ラベルデータを用いて敵の自己エンコーダを訓練することにより、堅牢な顔画像埋め込みを取得する。
そして、モデルに特徴適応層と融合層を設け、最小限のアノテート画像を用いて目標タスクに効率的に適応する。
fsmaフレームワークは、幅広い顔画像アプリケーションにわたる汎用性において際立っている。
FSMAは最先端の数発のランドマーク検出性能を達成し、数発の顔のセグメンテーション、スタイリゼーション、顔の影除去タスクを初めて満足できるソリューションを提供する。
関連論文リスト
- Bridging the Gaps: Utilizing Unlabeled Face Recognition Datasets to Boost Semi-Supervised Facial Expression Recognition [5.750927184237346]
我々は、半教師付きFERを高めるために、大きな未ラベルの顔認識(FR)データセットを活用することに重点を置いている。
具体的には,アノテーションを使わずに大規模な顔画像の事前訓練を行う。
ラベル付き画像や多彩な画像の不足を緩和するために、Mixupベースのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2024-10-23T07:26:19Z) - Faceptor: A Generalist Model for Face Perception [52.8066001012464]
Faceptorは、よく設計されたシングルエンコーダのデュアルデコーダアーキテクチャを採用するために提案されている。
Faceptorへのレイヤアテンションにより、モデルが最適なレイヤから機能を適応的に選択して、望ましいタスクを実行することができる。
我々のトレーニングフレームワークは補助的な教師付き学習にも適用でき、年齢推定や表現認識といったデータスパースタスクの性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2024-03-14T15:42:31Z) - Fiducial Focus Augmentation for Facial Landmark Detection [4.433764381081446]
本稿では,モデルによる顔構造理解を高めるために,新しい画像強調手法を提案する。
我々は,Deep Canonical correlation Analysis (DCCA) に基づく損失を考慮した,シームズアーキテクチャに基づくトレーニング機構を採用している。
提案手法は,様々なベンチマークデータセットにおいて,最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2024-02-23T01:34:00Z) - EFHQ: Multi-purpose ExtremePose-Face-HQ dataset [1.8194090162317431]
この研究は、Extreme Pose Face High-Qualityデータセット(EFHQ)と呼ばれる新しいデータセットを導入し、極端なポーズで顔の最大450kの高品質な画像を含む。
このような膨大なデータセットを生成するために、我々は、新しく精巧なデータセット処理パイプラインを使用して、2つの公開データセットをキュレートする。
我々のデータセットは、顔合成と2D/3D対応のGAN、拡散ベースの顔生成、顔の再現など、さまざまな顔関連タスクに関する既存のデータセットを補完することができる。
論文 参考訳(メタデータ) (2023-12-28T18:40:31Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z) - Learning Fast and Robust Target Models for Video Object Segmentation [83.3382606349118]
ビデオオブジェクトセグメンテーション(VOS)は、ターゲットオブジェクトを定義する初期マスクがテスト時にのみ与えられるため、非常に難しい問題である。
それまでのほとんどの場合、第1フレーム上のファイン・チューン・セグメンテーション・ネットワークにアプローチし、非現実的なフレームレートとオーバーフィッティングのリスクをもたらす。
本稿では,2つのネットワークコンポーネントからなる新しいVOSアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T21:58:06Z) - Deep Multi-Facial Patches Aggregation Network For Facial Expression
Recognition [5.735035463793008]
深層多面的パッチアグリゲーションネットワークに基づく顔表情認識(FER)のアプローチを提案する。
ディープ機能は、ディープサブネットワークを使用して顔のパッチから学習され、表現分類のために1つのディープアーキテクチャに集約される。
論文 参考訳(メタデータ) (2020-02-20T17:57:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。