Fugu-MT 論文翻訳(概要): Head Similarity: Modeling Structured Whole-Head Appearance Beyond Face Recognition

論文の概要: Head Similarity: Modeling Structured Whole-Head Appearance Beyond Face Recognition

arxiv url: http://arxiv.org/abs/2605.07766v1
Date: Fri, 08 May 2026 14:07:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-11 19:43:39.096917
Title: Head Similarity: Modeling Structured Whole-Head Appearance Beyond Face Recognition
Title（参考訳）: 頭部類似性: 顔認識を超えた構造付き全頭部外観のモデル化
Authors: Yingfeng Wang, Yuxuan Xiao, Shengcai Liao,
Abstract要約: 頭部類似性モデルにアイデンティティ中心の認識を拡張した新しい定式化である頭部類似性を導入する。本手法は, アイデンティティ内外見の変動を明示的に捉え, 同一性および外見状態の階層的類似性を強制する。最初のステップとして、階層的な監督とアイデンティティに配慮した蒸留を通じて、識別識別と外見に敏感な類似性を共同でモデル化する、シンプルで効果的なフレームワークを開発する。
参考スコア（独自算出の注目度）: 15.66689893756966
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Many vision applications require identity consistency beyond strict biometric recognition, especially under non-frontal views or when facial cues are missing. However, conventional face recognition models enforce intra-identity invariance, collapsing appearance variations such as hairstyle or styling changes into a single representation, limiting their use in appearance-sensitive scenarios. To address this limitation, we introduce Head Similarity, a new formulation that extends identity-centric recognition to structured whole-head similarity modeling. Our approach explicitly captures intra-identity appearance variation and enforces hierarchical similarity ordering across identity and appearance states, enabling meaningful comparison even under occlusion or rear-view conditions. We construct a large-scale benchmark from long-form videos with weakly-supervised appearance states, covering diverse poses, occlusions, and temporal changes. As a first step, we develop a simple yet effective framework that jointly models identity discrimination and appearance-sensitive similarity through hierarchical supervision and identity-aware distillation. Experiments show that conventional face recognition models fail to capture appearance-dependent similarity, while our approach demonstrates the feasibility of structured whole-head similarity modeling.
Abstract（参考訳）: 多くの視覚アプリケーションは、特に正面視や顔の手がかりが欠けている場合において、厳密な生体認証以上のアイデンティティの整合性を必要とする。しかし,従来の顔認識モデルでは,髪型やスタイリングなどの外観変化を1つの表現に分解し,外観に敏感なシナリオでの使用を制限している。この制限に対処するために、構造された全体頭部類似性モデリングにアイデンティティ中心の認識を拡張する新しい定式化であるヘッド類似性(Head similarity)を導入する。提案手法は,アイデンティティ内外見の変化を明示的に把握し,同一性や外見状態の階層的類似性を強制し,咬合条件や後見条件においても有意義な比較を可能にする。様々なポーズ、オクルージョン、時間的変化を網羅し、教師付き外観状態の弱い長大なビデオから大規模なベンチマークを構築した。最初のステップとして、階層的な監督と識別に配慮した蒸留を通じて、識別識別と外見に敏感な類似性を共同でモデル化する、シンプルで効果的なフレームワークを開発する。実験により,従来の顔認識モデルは外観に依存した類似性を捉えることができず,一方,本手法は頭部全体類似性モデルの実現可能性を示す。

関連論文リスト

Identity-Decoupled Anonymization for Visual Evidence in Multi-modal Retrieval-Augmented Generation [9.39195684989942]
Identity-Decoupled MRAGは、生成匿名化モジュールを検索と生成の間に介在するフレームワークである。提案手法は,各面を識別符号と空間的に構造化された属性コードに分解し,相互情報的ペナルティと勾配に基づく独立項で正規化する不整形変分エンコーダ,識別符号を元のものと現実とを区別することが保証された合成物に置換する多様体認識拒絶サンプリング器,および (iii)匿名化顔と置換IDとを合成する条件付き潜時拡散発生器からなる。
論文参考訳（メタデータ） (2026-04-26T07:42:33Z)
Optimizing ID Consistency in Multimodal Large Models: Facial Restoration via Alignment, Entanglement, and Disentanglement [54.199726425201895]
大規模モデルのマルチモーダル編集は、様々なタスクにまたがる強力な編集機能を示している。現在の顔認証保存法は、顔認証と編集済み要素IPの整合性回復に苦慮している。そこで我々は,頑健なアイデンティティ特異的顔復元のためのアライメント・ディスタングルメント・アンタングルメント・フレームワークであるEditedIDを提案する。
論文参考訳（メタデータ） (2026-02-21T08:24:42Z)
Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.29071072675132]
顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。 IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-10-28T09:28:12Z)
WithAnyone: Towards Controllable and ID Consistent Image Generation [83.55786496542062]
アイデンティティ・一貫性・ジェネレーションは、テキスト・ツー・イメージ研究において重要な焦点となっている。マルチパーソンシナリオに適した大規模ペアデータセットを開発する。本稿では,データと多様性のバランスをとるためにペアデータを活用する,対照的なアイデンティティ損失を持つ新たなトレーニングパラダイムを提案する。
論文参考訳（メタデータ） (2025-10-16T17:59:54Z)
PerFace: Metric Learning in Perceptual Facial Similarity for Enhanced Face Anonymization [33.653319607273495]
本稿では,人間の知覚に基づく顔類似度尺度を提案し,その類似度を予測するために6,400のトリプルトアノテーションとメートル法学習のデータセットを作成する。実験の結果,既存手法に比べて顔類似度予測と属性に基づく顔分類の双方において顕著な改善が認められた。
論文参考訳（メタデータ） (2025-09-24T16:15:43Z)
Robust ID-Specific Face Restoration via Alignment Learning [14.7430941613282]
本稿では,拡散モデルに基づく新しい顔復元フレームワークであるRobust ID-Specific Face Restoration (RIDFR)を提案する。 RIDFRにはアライメント・ラーニング(Alignment Learning)が組み込まれており、複数の参照からの復元結果を同一のアイデンティティと整合させて、ID非関連顔のセマンティクスの干渉を抑制する。実験により、我々のフレームワークは最先端の手法よりも優れており、高品質なID固有の結果を高いアイデンティティの忠実度で再現し、強靭性を示す。
論文参考訳（メタデータ） (2025-07-15T03:16:12Z)
FaceCrafter: Identity-Conditional Diffusion with Disentangled Control over Facial Pose, Expression, and Emotion [25.0180169554215]
本研究では,アイデンティティ保存を損なうことなく,ポーズ,表情,感情を正確に制御できる新しいアイデンティティ条件拡散モデルを提案する。提案手法は,ポーズ,表情,感情に対する制御精度の点で既存の手法を超越し,アイデンティティのみの条件下での生成の多様性を向上させる。
論文参考訳（メタデータ） (2025-05-21T09:43:21Z)
Disentangling Identity and Pose for Facial Expression Recognition [54.50747989860957]
より識別的な特徴表現を学習するために,識別モデルを提案し,不整形表情認識(IPD-FER)モデルを提案する。アイデンティティエンコーダでは、訓練中に訓練済みの顔認識モデルを利用して固定し、特定の表情訓練データに対する制限を軽減する。合成された中性画像と同一個体の表情画像との差を比較することにより、表現成分はアイデンティティやポーズからさらに切り離される。
論文参考訳（メタデータ） (2022-08-17T06:48:13Z)
Deep Collaborative Multi-Modal Learning for Unsupervised Kinship Estimation [53.62256887837659]
キンシップ検証は、コンピュータビジョンにおける長年の研究課題である。本稿では,顔特性に表される基礎情報を統合するために,新しい協調型多モーダル学習(DCML)を提案する。我々のDCML法は、常に最先端のキンシップ検証法よりも優れている。
論文参考訳（メタデータ） (2021-09-07T01:34:51Z)
Dual-Attention GAN for Large-Pose Face Frontalization [59.689836951934694]
本稿では,フォトリアリスティック顔フロンダル化のためのDA-GAN(Dual-Attention Generative Adversarial Network)を提案する。具体的には、ローカル機能と長距離依存関係を統合するために、自己アテンションベースのジェネレータが導入された。顔領域の局所的特徴を強調するために,新しい顔認識に基づく識別器を適用した。
論文参考訳（メタデータ） (2020-02-17T20:00:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。