Fugu-MT 論文翻訳(概要): DifFRelight: Diffusion-Based Facial Performance Relighting

論文の概要: DifFRelight: Diffusion-Based Facial Performance Relighting

arxiv url: http://arxiv.org/abs/2410.08188v1
Date: Thu, 10 Oct 2024 17:56:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-31 04:55:58.903597
Title: DifFRelight: Diffusion-Based Facial Performance Relighting
Title（参考訳）: DifFrelight: 拡散に基づく顔のパフォーマンスのリライト
Authors: Mingming He, Pascal Clausen, Ahmet Levent Taşel, Li Ma, Oliver Pilarski, Wenqi Xian, Laszlo Rikker, Xueming Yu, Ryan Burgert, Ning Yu, Paul Debevec,
Abstract要約: 拡散に基づく画像から画像への変換を用いた,自由視点顔の表情のリライティングのための新しいフレームワークを提案する。我々は、正確な照明制御のための拡散モデルを訓練し、フラットライト入力からの顔画像の高忠実度化を可能にする。このモデルは、目の反射、地表面散乱、自影、半透明といった複雑な照明効果を正確に再現する。
参考スコア（独自算出の注目度）: 12.909429637057343
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a novel framework for free-viewpoint facial performance relighting using diffusion-based image-to-image translation. Leveraging a subject-specific dataset containing diverse facial expressions captured under various lighting conditions, including flat-lit and one-light-at-a-time (OLAT) scenarios, we train a diffusion model for precise lighting control, enabling high-fidelity relit facial images from flat-lit inputs. Our framework includes spatially-aligned conditioning of flat-lit captures and random noise, along with integrated lighting information for global control, utilizing prior knowledge from the pre-trained Stable Diffusion model. This model is then applied to dynamic facial performances captured in a consistent flat-lit environment and reconstructed for novel-view synthesis using a scalable dynamic 3D Gaussian Splatting method to maintain quality and consistency in the relit results. In addition, we introduce unified lighting control by integrating a novel area lighting representation with directional lighting, allowing for joint adjustments in light size and direction. We also enable high dynamic range imaging (HDRI) composition using multiple directional lights to produce dynamic sequences under complex lighting conditions. Our evaluations demonstrate the models efficiency in achieving precise lighting control and generalizing across various facial expressions while preserving detailed features such as skintexture andhair. The model accurately reproduces complex lighting effects like eye reflections, subsurface scattering, self-shadowing, and translucency, advancing photorealism within our framework.
Abstract（参考訳）: 拡散に基づく画像から画像への変換を用いた,自由視点顔の表情のリライティングのための新しいフレームワークを提案する。フラットライトやワンライト・アット・ア・タイム(OLAT)のシナリオを含む様々な照明条件下で捉えた多様な表情を含む被写体固有のデータセットを利用して、正確な照明制御のための拡散モデルを訓練し、フラットライト入力からの高忠実度顔画像を可能にする。我々のフレームワークは、フラットライトキャプチャとランダムノイズの空間的整合条件と、事前学習された安定拡散モデルからの事前知識を利用して、グローバル制御のための統合照明情報を含む。このモデルは、一貫した平坦な環境下で捕捉された動的顔性能に適用され、スケーラブルな動的3Dガウススメッティング法を用いて新規ビュー合成のために再構成され、信頼性の高い結果の品質と整合性を維持する。また,新しい領域の照明表現を指向性照明と統合し,光サイズや方向の調整を可能にする統一照明制御を導入する。また,複数方向光を用いた高ダイナミックレンジイメージング(HDRI)合成により,複雑な照明条件下での動的シーケンス生成が可能となる。本評価では,肌色や毛髪などの詳細な特徴を保ちながら,正確な照明制御と様々な表情の一般化を行う上で,モデルの有効性を実証する。このモデルは、眼の反射、地表面散乱、自己シェードイング、透過性といった複雑な照明効果を正確に再現し、我々の枠組みの中で光リアリズムを前進させる。

関連論文リスト

GLOW: Global Illumination-Aware Inverse Rendering of Indoor Scenes Captured with Dynamic Co-Located Light & Camera [18.90141473604964]
室内シーンの逆レンダリングは、反射率と照明のあいまいさのため、依然として困難である。 GLOWは、これらの課題に対処するために設計された、Global Illumination-aware Inverse Renderingフレームワークである。
論文参考訳（メタデータ） (2025-11-28T03:24:12Z)
LightQANet: Quantized and Adaptive Feature Learning for Low-Light Image Enhancement [65.06462316546806]
低照度画像強調は、高品質な色とテクスチャを維持しながら照明を改善することを目的としている。既存の手法では、低照度条件下での画素レベルの情報劣化により、信頼性の高い特徴表現の抽出に失敗することが多い。低照度向上のための量子化・適応型特徴学習を実現する新しいフレームワークLightQANetを提案する。
論文参考訳（メタデータ） (2025-10-16T14:54:42Z)
ROGR: Relightable 3D Objects using Generative Relighting [71.35020300131261]
ROGRは,複数の視点から捉えたオブジェクトの3Dモデルを再構築する新しい手法である。我々は、入力された環境光の下で物体の外観を出力する照明条件のニューラルレージアンス場(NeRF)を訓練する。我々は、確立されたTensoIRおよびStanford-ORBデータセットに対する我々のアプローチを評価し、実世界のオブジェクトキャプチャに対する我々のアプローチを示す。
論文参考訳（メタデータ） (2025-10-03T16:35:22Z)
LuxDiT: Lighting Estimation with Video Diffusion Transformer [66.60450792095901]
単一の画像やビデオからシーンライティングを推定することは、コンピュータビジョンとグラフィックスにおいて長年の課題である。本稿では,映像拡散変換器を微調整し,視覚入力を前提としたHDR環境マップを生成するLuxDiTを提案する。
論文参考訳（メタデータ） (2025-09-03T19:59:20Z)
DIME-Net: A Dual-Illumination Adaptive Enhancement Network Based on Retinex and Mixture-of-Experts [7.6894262288762665]
本稿では,DIME-Netと呼ばれるデュアルイルミネーション向上フレームワークを提案する。 Retinex理論を統合することで、このモジュールは低照度画像とバックライト画像の両方に合わせた拡張を効果的に実行する。 DIME-Netは, 実世界の低照度データセットとバックライトデータセットの両方において, 再トレーニングを伴わずに, 競合性能を達成できることを示す。
論文参考訳（メタデータ） (2025-08-19T15:17:47Z)
SAIGFormer: A Spatially-Adaptive Illumination-Guided Network for Low-Light Image Enhancement [58.79901582809091]
近年, トランスフォーマーを用いた低照度化手法は, 世界照明の回復に有望な進展をもたらした。近年, トランスフォーマーを用いた低照度化手法は, 世界照明の回復に有望な進展をもたらした。正確な照明復元を可能にする空間適応照明誘導変圧器フレームワークを提案する。
論文参考訳（メタデータ） (2025-07-21T11:38:56Z)
LightLab: Controlling Light Sources in Images with Diffusion Models [49.83835236202516]
画像中の光源を微細かつパラメトリックに制御する拡散法を提案する。我々は、光の線形性を利用して、ターゲット光源または周囲照明の制御された光の変化を描写した画像対を合成する。提案手法は, ユーザの好みに基づいて, 従来の方法よりも優れた光編集結果が得られることを示す。
論文参考訳（メタデータ） (2025-05-14T17:57:27Z)
Retinex-Diffusion: On Controlling Illumination Conditions in Diffusion Models via Retinex Theory [19.205929427075965]
我々は,拡散モデルをブラックボックス画像レンダリングとして概念化し,そのエネルギー関数を画像形成モデルに沿って戦略的に分解する。これは、キャストシャドウ、ソフトシャドウ、反射間など、現実的な照明効果を持つ画像を生成する。
論文参考訳（メタデータ） (2024-07-29T03:15:07Z)
URHand: Universal Relightable Hands [64.25893653236912]
URHandは、視点、ポーズ、イルミネーション、アイデンティティを一般化する最初の普遍的照らし手モデルである。本モデルでは,携帯電話で撮影した画像によるパーソナライズが可能であり,新たな照明下でのフォトリアリスティックなレンダリングが可能である。
論文参考訳（メタデータ） (2024-01-10T18:59:51Z)
Relightful Harmonization: Lighting-aware Portrait Background Replacement [23.19641174787912]
背景画像を用いた背景像に対する高度な照明効果をシームレスに調和させるライティング対応拡散モデルであるRelightful Harmonizationを導入する。まず、拡散モデルを用いて、対象画像の背景から照明情報をエンコードする照明表現モジュールを導入する。第2に、画像背景から学習した照明特徴と、パノラマ環境マップから学習した照明特徴とを整列するアライメントネットワークを導入する。
論文参考訳（メタデータ） (2023-12-11T23:20:31Z)
EverLight: Indoor-Outdoor Editable HDR Lighting Estimation [9.443561684223514]
本稿では、パラメトリック光モデルと360degパノラマを組み合わせ、レンダリングエンジンでHDRIとして使用できる手法を提案する。我々の表現では、ユーザは光の方向、強度、数などを簡単に編集してシェーディングに影響を与えながら、リッチで複雑なリフレクションを提供しながら、編集とシームレスにブレンドすることができる。
論文参考訳（メタデータ） (2023-04-26T00:20:59Z)
TensoIR: Tensorial Inverse Rendering [51.57268311847087]
テンソルIRはテンソル分解とニューラルフィールドに基づく新しい逆レンダリング手法である。 TensoRFは、放射場モデリングのための最先端のアプローチである。
論文参考訳（メタデータ） (2023-04-24T21:39:13Z)
Neural Light Field Estimation for Street Scenes with Differentiable Virtual Object Insertion [129.52943959497665]
既存の屋外照明推定の作業は通常、シーン照明を環境マップに単純化する。単一画像から5次元HDR光場を推定するニューラルネットワークを提案する。自律運転アプリケーションにおけるARオブジェクト挿入の利点を示す。
論文参考訳（メタデータ） (2022-08-19T17:59:16Z)
DIB-R++: Learning to Predict Lighting and Material with a Hybrid Differentiable Renderer [78.91753256634453]
そこで本研究では,単体画像から固有物体特性を推定する難題について,微分可能量を用いて検討する。そこで本研究では、スペクトル化とレイトレーシングを組み合わせることで、これらの効果をサポートするハイブリッド微分可能なDIBR++を提案する。より高度な物理ベースの微分可能値と比較すると、DIBR++はコンパクトで表現力のあるモデルであるため、高い性能を持つ。
論文参考訳（メタデータ） (2021-10-30T01:59:39Z)
Sparse Needlets for Lighting Estimation with Spherical Transport Loss [89.52531416604774]
NeedleLightは、新しい照明推定モデルであり、必要に応じて照明を表現し、周波数領域と空間領域を共同で照明推定することができる。大規模な実験により、NeedleLightは、最先端の手法と比較して、複数の評価指標で常に優れた照明推定を実現していることがわかった。
論文参考訳（メタデータ） (2021-06-24T15:19:42Z)
Neural Video Portrait Relighting in Real-time via Consistency Modeling [41.04622998356025]
本稿では,リアルタイム,高品質,コヒーレントな映像ポートレートリライティングのためのニューラルアプローチを提案する。エンコーダデコーダアーキテクチャにおけるハイブリッド構造と照明非絡み合いを提案する。また,実世界における自然ポートレート光操作の照明一貫性と突然変異をモデル化する照明サンプリング戦略を提案する。
論文参考訳（メタデータ） (2021-04-01T14:13:28Z)
Light Stage Super-Resolution: Continuous High-Frequency Relighting [58.09243542908402]
光ステージから採取した人間の顔の「超解像」を学習ベースで解析する手法を提案する。本手法では,ステージ内の隣接する照明に対応する撮像画像を集約し,ニューラルネットワークを用いて顔の描画を合成する。我々の学習モデルは、リアルな影と特異なハイライトを示す任意の光方向のレンダリングを生成することができる。
論文参考訳（メタデータ） (2020-10-17T23:40:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。