論文の概要: StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition
- arxiv url: http://arxiv.org/abs/2604.21689v1
- Date: Thu, 23 Apr 2026 13:55:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.570166
- Title: StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition
- Title(参考訳): StyleID:Stylization-Agnostic Facial Recognitionのための知覚認識データセットとメトリクス
- Authors: Kwan Yun, Changmin Lee, Ayeong Jeong, Youngseo Kim, Seungmi Lee, Junyong Noh,
- Abstract要約: 創造的な顔のスタイリングは、認識可能なアイデンティティを維持しながら、さまざまな視覚的イディオムで肖像画を描画することを目的としている。
現在のアイデンティティエンコーダは、通常、自然写真に基づいて訓練され、校正され、スタイリゼーションの下で深刻な脆さを示す。
文体化下での顔認証のための認識認識データセットおよび評価フレームワークであるStyleIDを紹介する。
- 参考スコア(独自算出の注目度): 16.82557385108587
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Creative face stylization aims to render portraits in diverse visual idioms such as cartoons, sketches, and paintings while retaining recognizable identity. However, current identity encoders, which are typically trained and calibrated on natural photographs, exhibit severe brittleness under stylization. They often mistake changes in texture or color palette for identity drift or fail to detect geometric exaggerations. This reveals the lack of a style-agnostic framework to evaluate and supervise identity consistency across varying styles and strengths. To address this gap, we introduce StyleID, a human perception-aware dataset and evaluation framework for facial identity under stylization. StyleID comprises two datasets: (i) StyleBench-H, a benchmark that captures human same-different verification judgments across diffusion- and flow-matching-based stylization at multiple style strengths, and (ii) StyleBench-S, a supervision set derived from psychometric recognition-strength curves obtained through controlled two-alternative forced-choice (2AFC) experiments. Leveraging StyleBench-S, we fine-tune existing semantic encoders to align their similarity orderings with human perception across styles and strengths. Experiments demonstrate that our calibrated models yield significantly higher correlation with human judgments and enhanced robustness for out-of-domain, artist drawn portraits. All of our datasets, code, and pretrained models are publicly available at https://kwanyun.github.io/StyleID_page/
- Abstract(参考訳): 創造的な顔のスタイリングは、漫画、スケッチ、絵画などの様々な視覚的イディオムに肖像画を描き、識別可能なアイデンティティを保持することを目的としている。
しかし、現在のアイデンティティエンコーダは、通常、自然写真に基づいて訓練され、校正され、スタイリゼーションの下で深刻な脆さを示す。
彼らはしばしば、アイデンティティドリフトのためにテクスチャやカラーパレットの変化を間違えたり、幾何学的誇張を検出するのに失敗する。
これは、様々なスタイルと強みでアイデンティティの一貫性を評価し、監督するスタイルに依存しないフレームワークが欠如していることを明らかにする。
このギャップに対処するために、スタイリゼーション下での顔認証のための人間認識対応データセットおよび評価フレームワークであるStyleIDを導入する。
StyleIDには2つのデータセットがある。
(i)StyleBench-Hは、拡散及びフローマッチングに基づくスタイリゼーションを複数のスタイル強度で比較し、ヒトの等差判定をキャプチャするベンチマークである。
(II)StyleBench-Sは,2-alternative forced-choice (2AFC) 実験により得られた心理計測的認識強度曲線から導出した教師セットである。
StyleBench-Sを活用することで、既存のセマンティックエンコーダを微調整し、それらの類似性順序を、スタイルや強みをまたいだ人間の知覚と整合させる。
実験により、我々の校正されたモデルは、人間の判断と極めて高い相関性を示し、領域外、芸術家の肖像画の堅牢性を高めた。
データセット、コード、事前トレーニングされたモデルはすべて、https://kwanyun.github.io/StyleID_page/で公開されています。
関連論文リスト
- LatRef-Diff: Latent and Reference-Guided Diffusion for Facial Attribute Editing and Style Manipulation [78.6161238980415]
条件付きGANは進歩しているものの、精度の問題やトレーニング不安定性によって制限されている。
これらの制約に対処する新しい拡散ベースのフレームワークであるLatRef-Diffを提案する。
本稿では,LatRef-Diffが定性評価と定量的評価の両方において最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2026-04-23T04:47:40Z) - AnyID: Ultra-Fidelity Universal Identity-Preserving Video Generation from Any Visual References [52.81991915377852]
我々は,超忠実なアイデンティティ保存ビデオ生成フレームワークであるAnyIDを提案する。
まず,不均一な同一性入力を結合表現に効果的に統一する,スケーラブルなオムニ参照アーキテクチャを提案する。
第2に、1つの参照を標準アンカーとして指定し、新しい微分プロンプトを用いて正確な属性レベルの制御を可能にする一次参照生成パラダイムを提案する。
論文 参考訳(メタデータ) (2026-03-26T08:54:48Z) - DIFFER: Disentangling Identity Features via Semantic Cues for Clothes-Changing Person Re-ID [15.204652332980672]
衣服交換者再識別(CC-ReID)は、異なる衣服シナリオの下で個人を認識することを目的としている。
現在のCC-ReIDアプローチは、シルエット、ポーズ、ボディメッシュといった追加のモダリティを使用して、体形をモデル化することに集中している。
DIFFER: Disentangle Identity Features From Entangled Representations, a novel adversarial learning method that leverages textual descriptions to disentangle Identity Features。
論文 参考訳(メタデータ) (2025-03-28T23:40:59Z) - PS-StyleGAN: Illustrative Portrait Sketching using Attention-Based Style Adaptation [0.0]
ポートレートスケッチでは、抽象的な線と影で実際の顔のアイデンティティ固有の属性をキャプチャする。
本稿では,肖像画合成に適したスタイル転送手法である textbfPortrait Sketching StyleGAN (PS-StyleGAN) を提案する。
StyleGANのセマンティックな$W+$潜在空間を利用してポートレートスケッチを生成します。
論文 参考訳(メタデータ) (2024-08-31T04:22:45Z) - ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning [57.91881829308395]
AIポートレートや広告といった幅広いアプリケーションシナリオのために、ID-T2I(ID-preserving text-to-image generation)が注目されている。
我々は,ID-T2I性能を向上させるための一般的なフィードバック学習フレームワークである textbfID-Aligner を提案する。
論文 参考訳(メタデータ) (2024-04-23T18:41:56Z) - StyleForge: Enhancing Text-to-Image Synthesis for Any Artistic Styles with Dual Binding [7.291687946822539]
多様な芸術様式にまたがるパーソナライズされたテキスト・ツー・イメージ合成のための新しいアプローチであるSingle-StyleForgeを紹介した。
また、複数のトークンを部分的なスタイル属性に結合することで、画像の品質とテキストアライメントを向上させるMulti-StyleForgeを提案する。
論文 参考訳(メタデータ) (2024-04-08T07:43:23Z) - Few-shots Portrait Generation with Style Enhancement and Identity
Preservation [3.6937810031393123]
StyleIdentityGANモデルは、生成された肖像画のアイデンティティと芸術性を同時に確保することができる。
スタイル強化モジュールは、生成した仮想顔画像の芸術性を改善するために、デカップリングと転送の芸術的スタイルの特徴に焦点を当てている。
アートやアイデンティティ効果の最先端手法よりもStyleIdentityGANの方が優れていることを示す実験を行った。
論文 参考訳(メタデータ) (2023-03-01T10:02:12Z) - Few-shot Font Generation by Learning Style Difference and Similarity [84.76381937516356]
異なるスタイルの違いと同一スタイルの類似性(DS-Font)を学習する新しいフォント生成手法を提案する。
具体的には,提案するクラスタレベルコントラシブ・スタイル(CCS)の損失により,スタイルエンコーディングを実現する多層型プロジェクタを提案する。
論文 参考訳(メタデータ) (2023-01-24T13:57:25Z) - Realtime Fewshot Portrait Stylization Based On Geometric Alignment [32.224973317381426]
本稿では,リアルタイムなモバイルアプリケーションのためのポートレートスタイリング手法を提案する。
それまでの学習に基づくスタイリング手法は、ポートレートドメインとスタイルドメインの間の幾何学的および意味的なギャップに悩まされていた。
人間の顔の属性の幾何学的先行に基づいて,この問題に対処するために幾何学的アライメントを活用することを提案する。
論文 参考訳(メタデータ) (2022-11-28T16:53:19Z) - T-Person-GAN: Text-to-Person Image Generation with Identity-Consistency
and Manifold Mix-Up [16.165889084870116]
テキストのみに条件付けされた高解像度の人物画像を生成するためのエンドツーエンドアプローチを提案する。
2つの新しいメカニズムで人物画像を生成するための効果的な生成モデルを開発する。
論文 参考訳(メタデータ) (2022-08-18T07:41:02Z) - Styleverse: Towards Identity Stylization across Heterogeneous Domains [70.13327076710269]
異種ドメイン間のIDS(IDentity Stylization)という課題を提案する。
有効な異種ネットワークベースのフレームワークである$Styleverse$を使用し、単一のドメイン認識ジェネレータを使用します。
$Styleverseは、他の最先端の方法と比較して、より忠実なアイデンティティスタイリングを実現する。
論文 参考訳(メタデータ) (2022-03-02T04:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。