論文の概要: PixPerfect: Seamless Latent Diffusion Local Editing with Discriminative Pixel-Space Refinement
- arxiv url: http://arxiv.org/abs/2512.03247v1
- Date: Tue, 02 Dec 2025 21:35:57 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 11:59:44.50058
- Title: PixPerfect: Seamless Latent Diffusion Local Editing with Discriminative Pixel-Space Refinement
- Title(参考訳): PixPerfect: 差別的なPixel空間リファインメントによるシームレス遅延拡散局所編集
- Authors: Haitian Zheng, Yuan Yao, Yongsheng Yu, Yuqian Zhou, Jiebo Luo, Zhe Lin,
- Abstract要約: PixPerfectは、さまざまなLCMアーキテクチャやタスクにまたがるシームレスで高忠実なローカル編集を提供するピクセルレベルの精細化フレームワークである。
インペイント、オブジェクト除去、挿入ベンチマークの実験により、PixPerfectは知覚の忠実度と下流編集性能を大幅に向上させることが示された。
- 参考スコア(独自算出の注目度): 52.21370023312275
- License:
- Abstract: Latent Diffusion Models (LDMs) have markedly advanced the quality of image inpainting and local editing. However, the inherent latent compression often introduces pixel-level inconsistencies, such as chromatic shifts, texture mismatches, and visible seams along editing boundaries. Existing remedies, including background-conditioned latent decoding and pixel-space harmonization, usually fail to fully eliminate these artifacts in practice and do not generalize well across different latent representations or tasks. We introduce PixPerfect, a pixel-level refinement framework that delivers seamless, high-fidelity local edits across diverse LDM architectures and tasks. PixPerfect leverages (i) a differentiable discriminative pixel space that amplifies and suppresses subtle color and texture discrepancies, (ii) a comprehensive artifact simulation pipeline that exposes the refiner to realistic local editing artifacts during training, and (iii) a direct pixel-space refinement scheme that ensures broad applicability across diverse latent representations and tasks. Extensive experiments on inpainting, object removal, and insertion benchmarks demonstrate that PixPerfect substantially enhances perceptual fidelity and downstream editing performance, establishing a new standard for robust and high-fidelity localized image editing.
- Abstract(参考訳): Latent Diffusion Models (LDMs) は画像の描画と局所的な編集の質を著しく向上させた。
しかし、固有の潜伏圧縮は、色調シフト、テクスチャミスマッチ、編集境界に沿った目に見えるシームなど、ピクセルレベルの不整合をもたらすことが多い。
背景条件付きラテント復号やピクセル空間の調和といった既存の治療法は、実際にはこれらのアーティファクトを完全に排除できず、様々なラテント表現やタスクをうまく一般化しない。
PixPerfectは、様々なLCMアーキテクチャやタスクをまたいだシームレスで高忠実なローカル編集を実現する、ピクセルレベルの精細化フレームワークである。
PixPerfectが活用
(i)微妙な色とテクスチャの相違を増幅し抑制する識別可能な画素空間。
二 訓練中の実地編集物に精錬機を露出させる総合的な人工物シミュレーションパイプライン
(iii)多彩な潜在表現やタスクにまたがる広い適用性を確保するための直接画素空間改善方式。
インペイント、オブジェクト除去、挿入ベンチマークに関する大規模な実験により、PixPerfectは知覚の忠実度と下流の編集性能を大幅に向上し、ロバストで高忠実なローカライズされた画像編集のための新しい標準を確立した。
関連論文リスト
- Local-Global Context-Aware and Structure-Preserving Image Super-Resolution [23.87231269881077]
安定拡散(Stable Diffusion)のような事前訓練されたテキスト・ツー・イメージモデルは、リアルな画像コンテンツを合成する強力な能力を示した。
本稿では,局所的およびグローバルな画素関係を効果的に維持する,文脈的に正確な画像超解像フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-11T07:17:31Z) - IntrinsicEdit: Precise generative image manipulation in intrinsic space [53.404235331886255]
そこで本研究では,固有画像空間で動作する汎用的生成ワークフローを提案する。
我々はアイデンティティの保存と内在チャネルの絡み合いの鍵となる課題に対処する。
我々は,グローバル照明効果の自動分解による高精度かつ効率的な編集を可能にする。
論文 参考訳(メタデータ) (2025-05-13T18:24:15Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - PFB-Diff: Progressive Feature Blending Diffusion for Text-driven Image Editing [9.333499287832202]
PFB-Diffは拡散に基づく画像編集のためのプログレッシブ・フィーチャーブレンディング法である。
PFB-Diffは多レベル特徴ブレンディングによりテキスト誘導された生成されたコンテンツをターゲット画像にシームレスに統合する。
本手法は、微調整や訓練を必要とせず、編集精度と画質の点で優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-28T11:10:20Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。