論文の概要: BeautyGRPO: Aesthetic Alignment for Face Retouching via Dynamic Path Guidance and Fine-Grained Preference Modeling
- arxiv url: http://arxiv.org/abs/2603.01163v1
- Date: Sun, 01 Mar 2026 15:59:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.545185
- Title: BeautyGRPO: Aesthetic Alignment for Face Retouching via Dynamic Path Guidance and Fine-Grained Preference Modeling
- Title(参考訳): BeautyGRPO:ダイナミックパス誘導とファイングラインド参照モデリングによる顔のリタッチのための美的アライメント
- Authors: Jiachen Yang, Xianhui Lin, Yi Dong, Zebiao Zheng, Xing Liu, Hong Gu, Yanmei Fang,
- Abstract要約: 顔のリタッチには、全体的な美的魅力を高めるために、独特の顔認証機能を保持しながら微妙な欠陥を取り除く必要がある。
既存の手法は基本的なトレードオフに苦しむ。ラベル付きデータに対する教師付き学習はピクセルレベルのラベルの模倣に制約され、複雑な主観的人間の美的嗜好を捉えることができない。
顔のリタッチと人間の美的嗜好を一致させる強化学習フレームワークであるBeautyGRPOを提案する。
- 参考スコア(独自算出の注目度): 29.77085426345252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face retouching requires removing subtle imperfections while preserving unique facial identity features, in order to enhance overall aesthetic appeal. However, existing methods suffer from a fundamental trade-off. Supervised learning on labeled data is constrained to pixel-level label mimicry, failing to capture complex subjective human aesthetic preferences. Conversely, while online reinforcement learning (RL) excels at preference alignment, its stochastic exploration paradigm conflicts with the high-fidelity demands of face retouching and often introduces noticeable noise artifacts due to accumulated stochastic drift. To address these limitations, we propose BeautyGRPO, a reinforcement learning framework that aligns face retouching with human aesthetic preferences. We construct FRPref-10K, a fine-grained preference dataset covering five key retouching dimensions, and train a specialized reward model capable of evaluating subtle perceptual differences. To reconcile exploration and fidelity, we introduce Dynamic Path Guidance (DPG). DPG stabilizes the stochastic sampling trajectory by dynamically computing an anchor-based ODE path and replanning a guided trajectory at each sampling timestep, effectively correcting stochastic drift while maintaining controlled exploration. Extensive experiments show that BeautyGRPO outperforms both specialized face retouching methods and general image editing models, achieving superior texture quality, more accurate blemish removal, and overall results that better align with human aesthetic preferences.
- Abstract(参考訳): 顔のリタッチには、全体的な美的魅力を高めるために、独特の顔認証機能を保持しながら微妙な欠陥を取り除く必要がある。
しかし、既存の手法は根本的なトレードオフに悩まされている。
ラベル付きデータの教師付き学習は、複雑な主観的人間の美的嗜好を捉えないピクセルレベルのラベルの模倣に制約される。
逆に、オンライン強化学習(RL)は好みの調整に優れているが、その確率的探索パラダイムは顔修正の高忠実度要求と矛盾し、しばしば確率的ドリフトの蓄積による顕著なノイズアーティファクトを導入する。
これらの制約に対処するために,顔のリタッチと人間の美的嗜好を一致させる強化学習フレームワークであるBeautyGRPOを提案する。
FRPref-10Kは,5つのキーの修正次元をカバーする微粒な嗜好データセットであり,微妙な知覚差を評価できる特別報酬モデルを訓練する。
探索と忠実さを両立させるために,動的経路誘導(DPG)を導入する。
DPGは、アンカーベースのODEパスを動的に計算し、サンプリングの各ステップでガイドされた軌道を計画することで確率的サンプリング軌道を安定化し、制御された探索を維持しながら確率的ドリフトを効果的に補正する。
大規模な実験により、BeautyGRPOは特殊顔のリタッチ法と一般的な画像編集モデルの両方より優れており、優れたテクスチャ品質、より正確なブラディッシュ除去、そして人間の美的嗜好に適合する全体的な結果が得られている。
関連論文リスト
- Preference Score Distillation: Leveraging 2D Rewards to Align Text-to-3D Generation with Human Preference [69.34278282513593]
Preference Score Distillation (PSD) は、3Dトレーニングデータなしでテキストから3D合成を行うための最適化ベースのフレームワークである。
我々の重要な洞察は、ピクセルレベルの勾配の不整合性に起因している。
我々は、好みスコアと負のテキスト埋め込みを協調最適化するための適応戦略を導入する。
論文 参考訳(メタデータ) (2026-03-02T08:23:36Z) - Synthetic Craquelure Generation for Unsupervised Painting Restoration [17.344021694835345]
ドメイン固有の合成クラックルアジェネレータによって駆動される完全にアノテーションのないフレームワークを提案する。
我々のアプローチでは、古典的なモルフォロジー検出器と学習ベースリファインメントモジュールを結合する。
私たちのパイプラインは、ゼロショット設定で最先端の写真復元モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-02-13T09:13:46Z) - PerTouch: VLM-Driven Agent for Personalized and Semantic Image Retouching [54.3683137773426]
本稿ではPerTouchと呼ばれる拡散型画像修正フレームワークを提案する。
本手法は,グローバルな美学を維持しつつ,セマンティックレベルのイメージリタッチをサポートする。
我々は,強力なユーザ命令と弱いユーザ命令の両方を扱えるVLMエージェントを開発した。
論文 参考訳(メタデータ) (2025-11-17T05:39:15Z) - Finetuning-Free Personalization of Text to Image Generation via Hypernetworks [15.129799519953139]
被写体画像から直接LoRA適応重量を予測するHypernetworksによる微調整不要なパーソナライゼーションを提案する。
提案手法はパーソナライズ性能を向上し,オープンカテゴリパーソナライズのためのスケーラブルで効果的な方向としてのハイパーネットワークの約束を強調する。
論文 参考訳(メタデータ) (2025-11-05T03:31:33Z) - Unlocking the Essence of Beauty: Advanced Aesthetic Reasoning with Relative-Absolute Policy Optimization [63.169050703903515]
強化学習(RL)を用いた包括的審美的推論フレームワークAes-R1を提案する。
Aes-R1はパイプライン、AesCoTを統合し、高品質なチェーン・オブ・プリーティングデータの構築とフィルタリングを行う。
実験により、Aes-R1は背骨の平均PLCC/SRCCを47.9%/34.8%改善することが示された。
論文 参考訳(メタデータ) (2025-09-26T04:55:00Z) - Bi-Level Optimization for Self-Supervised AI-Generated Face Detection [56.57881725223548]
両レベル最適化に基づくAI生成顔検出器の自己教師方式を提案する。
我々の検出器は、一級・二級の分類設定において、既存のアプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-07-30T16:38:29Z) - DynFaceRestore: Balancing Fidelity and Quality in Diffusion-Guided Blind Face Restoration with Dynamic Blur-Level Mapping and Guidance [29.961208234237635]
Blind Face Restorationは、未知の劣化した入力から高忠実で詳細な顔画像を取り戻すことを目的としている。
視覚的に劣化した入力をぼやけた画像にマッピングする方法を学習する新しいブラインドフェイス復元手法であるDynFaceRestoreを提案する。
DynFaceRestoreは、定量評価と定性評価の両方において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-07-18T10:16:08Z) - Joint angle model based learning to refine kinematic human pose estimation [8.6527127612359]
現在のヒトのポーズ推定(HPE)は、キーポイント認識における時折エラーとキーポイント軌跡におけるランダムな変動に悩まされる。
本稿では,関節角度に基づくモデリングにより,難易度を克服する手法を提案する。
双方向リカレントネットワークは、確立されたHRNetの推定を洗練するための後処理モジュールとして設計されている。
論文 参考訳(メタデータ) (2025-07-15T08:16:39Z) - RetouchingFFHQ: A Large-scale Dataset for Fine-grained Face Retouching
Detection [25.08843970102635]
大規模かつきめ細かい顔リタッチデータセットであるRetouchingFFHQを紹介する。
4種類の顔リタッチ操作と異なる顔リタッチレベルを含むことにより、両顔リタッチ検出を細粒度、マルチリタッチ型、マルチリタッチレベル推定問題に拡張する。
論文 参考訳(メタデータ) (2023-07-20T07:12:56Z) - Towards Robust Blind Face Restoration with Codebook Lookup Transformer [94.48731935629066]
ブラインドフェイスの修復は、しばしば補助的なガイダンスを必要とする非常に不適切な問題である。
学習した個別のコードブックを小さなプロキシ空間に配置し,ブラインドフェイスの復元をコード予測タスクとすることを示す。
我々は、低品質顔のグローバルな構成とコンテキストをモデル化するトランスフォーマーベースの予測ネットワーク、CodeFormerを提案する。
論文 参考訳(メタデータ) (2022-06-22T17:58:01Z) - SFace: Sigmoid-Constrained Hypersphere Loss for Robust Face Recognition [74.13631562652836]
SFace(Sigmoid-Constrained hypersphere loss)と呼ばれる新しい損失関数を提案する。
SFaceは2つのシグモイド勾配再スケール関数によってそれぞれ制御される超球面多様体にクラス内およびクラス間制約を課す。
クラス内距離を減らし、ラベルノイズへの過度な適合を防ぎ、より堅牢なディープ顔認識モデルに寄与する。
論文 参考訳(メタデータ) (2022-05-24T11:54:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。