論文の概要: LiWi: Layering in the Wild
- arxiv url: http://arxiv.org/abs/2605.14552v2
- Date: Thu, 21 May 2026 08:05:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.410451
- Title: LiWi: Layering in the Wild
- Title(参考訳): LiWi: 野生でのレイヤー化
- Authors: Yu He, Fang Li, Haoyang Tong, Lichen Ma, Xinyuan Shan, Jingling Fu, Dong Chen, Luohang Liu, Junshi Huang, Yan Li,
- Abstract要約: 地中画像の層化はいまだ未解決の問題である。
本稿では,高忠実度自然画像分解のための新しいフレームワークを提案する。
我々のフレームワークは、自然画像分解における最先端(SoTA)性能を実現する。
- 参考スコア(独自算出の注目度): 21.045912859078353
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in generative models have empowered impressive layered image generation, yet their success is largely confined to graphic design domains. The layering of in-the-wild images remains an underexplored problem, limiting fine-grained editing and applications of images in real-world scenarios. Specifically, challenges remain in scalable layered data and the modeling of object interaction in natural images, such as illumination effects and structural boundary. To address these bottlenecks, we propose a novel framework for high-fidelity natural image decomposition. First, we introduce an Agent-driven Data Decomposition (ADD) pipeline that orchestrates agents and tools to synthesize layered data without manual intervention. Utilizing this pipeline, we construct a large-scale dataset, named LiWi-100k, with over 100,000 high-quality layered in-the-wild images. Second, we present a novel framework that jointly improves photometric fidelity and alpha boundary accuracy. Specifically, shadow-guided learning explicitly models the illumination effects, and degradation-restoration objective provides boundary-correction supervision by recovering clean foreground image from degraded one. Extensive experiments demonstrate that our framework achieves state-of-the-art (SoTA) performance in natural image decomposition, outperforming existing models in RGB L1 and Alpha IoU metrics. We will soon release our code and dataset.
- Abstract(参考訳): 生成モデルの最近の進歩は印象的な階層画像生成に力を与えてきたが、その成功はグラフィックデザイン領域に限られている。
地中画像の階層化はいまだ未解決の問題であり、実際のシナリオにおける画像のきめ細かい編集や応用を制限している。
具体的には、スケーラブルな階層データや、照明効果や構造境界といった自然画像におけるオブジェクト相互作用のモデリングに課題が残っている。
これらのボトルネックに対処するため,我々は高忠実度自然画像分解のための新しい枠組みを提案する。
まず,エージェント駆動型データ分解(ADD)パイプラインを導入する。
このパイプラインを利用すると、LiWi-100kという名の大規模なデータセットを構築し、100,000以上の高品質なインザ・ワイヤド・イメージを作成します。
第2に、光学的忠実度とアルファ境界精度を協調的に向上する新しい枠組みを提案する。
具体的には、影誘導学習は、照明効果を明示的にモデル化し、劣化した画像からクリーンな前景像を復元することにより、境界補正を行う。
RGB L1およびAlpha IoU測定値において既存のモデルよりも優れており,本フレームワークは自然な画像分解において最先端(SoTA)性能を実現することが実証された。
間もなくコードとデータセットをリリースします。
関連論文リスト
- Controllable Layered Image Generation for Real-World Editing [49.81321254149423]
LASAGNAは、その構成層と共同で画像を生成する、新しく統合されたフレームワークである。
クリーンな背景とRGBAフォアグラウンドからなる新しいデータセットであるLASAGNA-48Kを紹介した。
LASAGNAは複数の画像層にまたがって高度に一貫性があり一貫性のある結果を生成するのに優れていることを示す。
論文 参考訳(メタデータ) (2026-01-21T22:29:33Z) - From Inpainting to Layer Decomposition: Repurposing Generative Inpainting Models for Image Layer Decomposition [16.7393689710179]
レイヤ化された表現により、要素の独立した編集が可能になり、コンテンツ作成の柔軟性が向上する。
我々は, 層分解と in/outpainting タスクの強い関係を観察し, 軽量微細化による層分解に対する拡散型インペインティングモデルの適用を提案する。
潜伏空間の細部をより詳細に保存するために,線形注意複雑性を持つ新しいマルチモーダルコンテキスト融合モジュールを導入する。
論文 参考訳(メタデータ) (2025-11-26T02:50:07Z) - RealRAG: Retrieval-augmented Realistic Image Generation via Self-reflective Contrastive Learning [54.07026389388881]
第1回リアルタイムオブジェクトベース検索拡張生成フレームワーク(RealRAG)を提案する。
RealRAGは、生成モデルの知識ギャップを克服するために、現実世界の画像の学習と検索によって、細粒で目に見えない新しいオブジェクトを生成する。
本フレームワークは, 生成モデルに対するきめ細かな視覚的知識を統合し, 歪み問題に対処し, オブジェクト生成における現実性を改善する。
論文 参考訳(メタデータ) (2025-02-02T16:41:54Z) - OmniEraser: Remove Objects and Their Effects in Images with Paired Video-Frame Data [21.469971783624402]
本稿では,現実的な物体影と反射を伴う10万以上の高品質なサンプルからなる大規模データセットであるVideo4Removalを提案する。
ビデオフレームと市販のビジョンモデルからオブジェクト-バックグラウンドペアを構築することにより、データ取得の作業コストを大幅に削減することができる。
形状的なアーティファクトや意図しないコンテンツを生成するのを避けるために,Object-Background Guidanceを提案する。
我々は,オブジェクトマスクのみを入力として,オブジェクトとその視覚効果をシームレスに除去する新しい手法であるOmniEraserを提案する。
論文 参考訳(メタデータ) (2025-01-13T15:12:40Z) - Generative Image Layer Decomposition with Visual Effects [49.75021036203426]
LayerDecompは、イメージ層分解のための生成フレームワークである。
清潔な背景と、忠実に保存された視覚効果を持つ高品質な透明な前景を作り出す。
本手法は,オブジェクト除去や空間編集作業において,既存の手法よりも優れた分解特性を実現する。
論文 参考訳(メタデータ) (2024-11-26T20:26:49Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。