論文の概要: Toward Real-World Adoption of Portrait Relighting via Hybrid Domain Knowledge Fusion
- arxiv url: http://arxiv.org/abs/2604.23094v1
- Date: Sat, 25 Apr 2026 01:16:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.151597
- Title: Toward Real-World Adoption of Portrait Relighting via Hybrid Domain Knowledge Fusion
- Title(参考訳): ハイブリッドドメイン知識融合によるポートレートライティングの現実化に向けて
- Authors: Qian Huang, Mayoore Selvarasa Jaiswal, Zhen Zhong, Rochelle Pereira, Jianyuan Min,
- Abstract要約: 本稿では,合成,ワンライト・アット・ア・タイム(OLAT),および実世界のデータセットの特殊強度を,コンパクトなモデルに融合させるパラダイムを提案する。
提案手法は, ドメイン認識適応により強化された先行モデルと, 軽量な学生モデルに付加された知識蒸留を特徴とする。
トレーニングパイプラインをサポートするために,多種多様な地中構造を持つ大規模で高忠実な合成データセットを構築した。
- 参考スコア(独自算出の注目度): 17.59278811759214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The real-world adoption of portrait relighting is hindered by dataset domain gaps, camera sensitivity, and computational costs. We address these challenges with Hybrid Domain Knowledge Fusion, a paradigm that fuses the specialized strengths of synthetic, One-Light-at-A-Time (OLAT), and real-world datasets into a compact model. Our approach features specialized prior models hardened by domain-aware adaptation, followed by augmented knowledge distillation into a lightweight student model with multi-domain expertise. Our method demonstrates a 6x to 240x inference speedup while maintaining state-of-the-art (SOTA) visual quality in the experiments. Additionally, we construct a massive, high-fidelity synthetic dataset with diverse ground-truth intrinsics to support our training pipeline.
- Abstract(参考訳): ポートレートリライティングの現実的な採用は、データセットドメインのギャップ、カメラの感度、計算コストによって妨げられている。
合成、ワンライト・アット・ア・タイム(OLAT)、実世界のデータセットをコンパクトなモデルに融合するパラダイムであるHybrid Domain Knowledge Fusionでこれらの課題に対処する。
提案手法は,ドメイン認識適応により強化された先行モデルに特化し,さらに知識蒸留を多分野の専門知識を持つ軽量の学生モデルに拡張した。
提案手法は,実験中における最先端の視覚的品質を維持しつつ,6倍から240倍の推論速度を示す。
さらに、トレーニングパイプラインをサポートするために、多様な地中構造を持つ大規模で高忠実な合成データセットを構築した。
関連論文リスト
- Addressing the Depth-of-Field Constraint: A New Paradigm for High Resolution Multi-Focus Image Fusion [4.001780301402233]
マルチフォーカス画像融合(MFIF)は、光学レンズの奥行き制限(DOF)に対処する。
本稿では,高忠実かつ効率的な画像再構成のための蒸留変分オートエンコーダを用いた新しいMFIF手法VAEEDOFを提案する。
提案手法は, シームレスなアーティファクトフリーの融合画像を生成し, 合成シナリオと実世界のシナリオのギャップを埋める。
論文 参考訳(メタデータ) (2025-10-22T13:32:04Z) - UniRelight: Learning Joint Decomposition and Synthesis for Video Relighting [85.27994475113056]
我々はアルベドを共同で推定し、単一のパスで信頼出力を合成する汎用的アプローチを導入する。
本モデルは,多様な領域にまたがる強力な一般化を示し,視覚的忠実度と時間的整合性の両方において,従来の手法を超越している。
論文 参考訳(メタデータ) (2025-06-18T17:56:45Z) - Boosting Zero-shot Stereo Matching using Large-scale Mixed Images Sources in the Real World [8.56549004133167]
ステレオマッチング法は、密度の高いピクセル単位の基底真理ラベルに依存している。
ラベル付きデータの不足と、合成画像と実世界の画像のドメインギャップは、注目すべき課題である。
視覚基盤モデルと大規模混合画像ソースの両方を活用する新しいフレームワーク textbfBooSTer を提案する。
論文 参考訳(メタデータ) (2025-05-13T14:24:38Z) - IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations [64.07859467542664]
画像から幾何学的および物質的情報をキャプチャすることは、コンピュータビジョンとグラフィックスの基本的な課題である。
従来の最適化に基づく手法では、密集した多視点入力から幾何学、材料特性、環境照明を再構築するために数時間の計算時間を必要とすることが多い。
IDArbは、様々な照明条件下で、任意の画像に対して本質的な分解を行うために設計された拡散モデルである。
論文 参考訳(メタデータ) (2024-12-16T18:52:56Z) - A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.14745782076976]
マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文 参考訳(メタデータ) (2023-12-17T04:45:15Z) - TensoIR: Tensorial Inverse Rendering [51.57268311847087]
テンソルIRはテンソル分解とニューラルフィールドに基づく新しい逆レンダリング手法である。
TensoRFは、放射場モデリングのための最先端のアプローチである。
論文 参考訳(メタデータ) (2023-04-24T21:39:13Z) - Rethinking Blur Synthesis for Deep Real-World Image Deblurring [4.00114307523959]
本稿では,撮影過程をシミュレートする,新しいリアルなボケ合成パイプラインを提案する。
機能領域における非局所的依存関係と局所的コンテキストを同時にキャプチャする効果的なデブロアリングモデルを開発する。
3つの実世界のデータセットに関する総合的な実験により、提案したデブロアリングモデルは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-09-28T06:50:16Z) - Partially fake it till you make it: mixing real and fake thermal images
for improved object detection [29.13557322147509]
熱画像における物体検出の文脈における提案システムの性能について述べる。
我々の単一モード検出器はFLIR ADASデータセットの最先端結果を達成する。
論文 参考訳(メタデータ) (2021-06-25T12:56:09Z) - DASGIL: Domain Adaptation for Semantic and Geometric-aware Image-based
Localization [27.294822556484345]
環境変化下での視覚的長期化は、自律走行と移動ロボット工学において難しい問題である。
視覚的位置認識のための多スケール潜在埋め込み表現に幾何学的および意味的情報を融合する新しいマルチタスクアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-01T17:44:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。