論文の概要: FlowIID: Single-Step Intrinsic Image Decomposition via Latent Flow Matching
- arxiv url: http://arxiv.org/abs/2601.12329v1
- Date: Sun, 18 Jan 2026 09:29:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.578659
- Title: FlowIID: Single-Step Intrinsic Image Decomposition via Latent Flow Matching
- Title(参考訳): FlowIID:潜時流マッチングによる単段固有画像分解
- Authors: Mithlesh Singla, Seema Kumari, Shanmuganathan Raman,
- Abstract要約: 固有画像分解(IID)は、画像をアルベドとシェーディングコンポーネントに分離する。
既存のIDモデルは良い結果を得るが、多くのパラメータを使用することが多い。
本稿では,フローマッチングに基づくフローマッチング手法であるFlowIIDを提案する。
- 参考スコア(独自算出の注目度): 8.760585284025144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intrinsic Image Decomposition (IID) separates an image into albedo and shading components. It is a core step in many real-world applications, such as relighting and material editing. Existing IID models achieve good results, but often use a large number of parameters. This makes them costly to combine with other models in real-world settings. To address this problem, we propose a flow matching-based solution. For this, we design a novel architecture, FlowIID, based on latent flow matching. FlowIID combines a VAE-guided latent space with a flow matching module, enabling a stable decomposition of albedo and shading. FlowIID is not only parameter-efficient, but also produces results in a single inference step. Despite its compact design, FlowIID delivers competitive and superior results compared to existing models across various benchmarks. This makes it well-suited for deployment in resource-constrained and real-time vision applications.
- Abstract(参考訳): 固有画像分解(IID)は、画像をアルベドとシェーディングコンポーネントに分離する。
これは、リライトやマテリアル編集など、現実世界の多くのアプリケーションにおける中核的なステップである。
既存のIDモデルは良い結果を得るが、多くのパラメータを使用することが多い。
これにより、現実世界の設定で他のモデルと組み合わせるのにコストがかかる。
この問題に対処するために,フローマッチングに基づく解を提案する。
そこで我々は,潜在フローマッチングに基づく新しいアーキテクチャであるFlowIIDを設計する。
FlowIIDは、VAE誘導の潜伏空間とフローマッチングモジュールを組み合わせることで、アルベドとシェーディングの安定な分解を可能にする。
FlowIIDはパラメータ効率だけでなく、単一の推論ステップで結果も生成する。
コンパクトな設計にもかかわらず、FlowIIDは様々なベンチマークで既存のモデルと比較して、競争力と優れた結果をもたらす。
これにより、リソース制約のあるリアルタイムビジョンアプリケーションへのデプロイに適しています。
関連論文リスト
- Structural Similarity-Inspired Unfolding for Lightweight Image Super-Resolution [88.20464308588889]
効率的な画像SRのための構造類似インスパイアド・アンフォールディング(SSIU)法を提案する。
この方法は、構造的類似性に制約されたSR最適化関数の展開によって設計される。
我々のモデルは現在の最先端モデルより優れており、パラメータ数が低く、メモリ消費が減少している。
論文 参考訳(メタデータ) (2025-06-13T14:29:40Z) - An Efficient and Mixed Heterogeneous Model for Image Restoration [71.85124734060665]
現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。
混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文 参考訳(メタデータ) (2025-04-15T08:19:12Z) - Mixed Degradation Image Restoration via Local Dynamic Optimization and Conditional Embedding [67.57487747508179]
マルチインワン画像復元 (IR) は, 一つのモデルで全ての種類の劣化画像復元を処理し, 大幅な進歩を遂げている。
本稿では,単一と混合の分解で画像を効果的に復元できる新しいマルチインワンIRモデルを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:26:34Z) - ToddlerDiffusion: Interactive Structured Image Generation with Cascaded Schrödinger Bridge [63.00793292863]
ToddlerDiffusionは、RGB画像生成の複雑なタスクを、よりシンプルで解釈可能なステージに分解するための新しいアプローチである。
提案手法はToddler Diffusionと呼ばれ,それぞれが中間表現を生成する責務を担っている。
ToddlerDiffusionは、常に最先端のメソッドより優れています。
論文 参考訳(メタデータ) (2023-11-24T15:20:01Z) - TIDE: Temporally Incremental Disparity Estimation via Pattern Flow in
Structured Light System [17.53719804060679]
TIDE-Netはモノカメラ構造光システムにおける差分計算の学習手法である。
得られた画像列に投影されたパターン(パターンフロー)の変形を利用して時間情報をモデル化する。
入力フレーム毎に、パターンフローに歪んだ相関ボリューム(現在のフレームから)と不均一(以前のフレームから)を融合する。
論文 参考訳(メタデータ) (2023-10-13T07:55:33Z) - Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。
本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。
提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。