論文の概要: DIAMOND: Directed Inference for Artifact Mitigation in Flow Matching Models
- arxiv url: http://arxiv.org/abs/2602.00883v1
- Date: Sat, 31 Jan 2026 20:08:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.448412
- Title: DIAMOND: Directed Inference for Artifact Mitigation in Flow Matching Models
- Title(参考訳): DIAMOND:フローマッチングモデルにおけるアーチファクト緩和のための直接推論
- Authors: Alicja Polowczyk, Agnieszka Polowczyk, Piotr Borycki, Joanna Waczyńska, Jacek Tabor, Przemysław Spurek,
- Abstract要約: DIAMONDは、推論中のアーティファクトを緩和するために軌道修正を適用する訓練不要の手法である。
生成軌道のすべてのステップでクリーンサンプルの見積を再構築することにより、DIAMONDは、人工物につながる潜在状態から生成プロセスを積極的に引き離す。
- 参考スコア(独自算出の注目度): 9.305906770890296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite impressive results from recent text-to-image models like FLUX, visual and anatomical artifacts remain a significant hurdle for practical and professional use. Existing methods for artifact reduction, typically work in a post-hoc manner, consequently failing to intervene effectively during the core image formation process. Notably, current techniques require problematic and invasive modifications to the model weights, or depend on a computationally expensive and time-consuming process of regional refinement. To address these limitations, we propose DIAMOND, a training-free method that applies trajectory correction to mitigate artifacts during inference. By reconstructing an estimate of the clean sample at every step of the generative trajectory, DIAMOND actively steers the generation process away from latent states that lead to artifacts. Furthermore, we extend the proposed method to standard Diffusion Models, demonstrating that DIAMOND provides a robust, zero-shot path to high-fidelity, artifact-free image synthesis without the need for additional training or weight modifications in modern generative architectures. Code is available at https://gmum.github.io/DIAMOND/
- Abstract(参考訳): FLUXのような最近のテキストと画像のモデルによる印象的な結果にもかかわらず、視覚的および解剖学的アーティファクトは、実用的および専門的な使用において重要なハードルとなっている。
アーティファクトリダクションの既存の手法は、典型的にはポストホックな方法で機能し、結果としてコア画像形成過程において効果的に介入することができない。
特に、現在の技術では、モデルウェイトに問題があり侵襲的な修正が必要であり、あるいは計算に高価で時間を要する地域改良のプロセスに依存している。
このような制約に対処するために,提案手法であるDIAMONDを提案する。
生成軌道のすべてのステップでクリーンサンプルの見積を再構築することにより、DIAMONDは、人工物につながる潜在状態から生成プロセスを積極的に引き離す。
さらに,提案手法を標準拡散モデルに拡張し,DIAMOND が高忠実でアーティファクトのない画像合成に頑健でゼロショットのパスを提供することを示す。
コードはhttps://gmum.github.io/DIAMOND/で入手できる。
関連論文リスト
- Universal Inverse Distillation for Matching Models with Real-Data Supervision (No GANs) [63.681263056053666]
提案するRealUIDは,GANを使わずに実データを蒸留プロセスにシームレスに組み込む,全てのマッチングモデルのための汎用蒸留フレームワークである。
我々のRealUIDアプローチは、フローマッチングと拡散モデルに対する以前の蒸留方法をカバーする単純な理論基盤を提供し、ブリッジマッチングや補間といった修正にも拡張されている。
論文 参考訳(メタデータ) (2025-09-26T15:12:02Z) - Penalizing Boundary Activation for Object Completeness in Diffusion Models [35.58050562158284]
拡散モデルはテキスト・トゥ・イメージ(T2I)生成の強力な技術として登場した。
本研究では,不完全性の問題を詳細に解析し,不完全オブジェクト生成の要因はモデルトレーニングにおけるRandomCropの利用であることを示す。
本稿では,初期認知段階において,画像境界におけるアクティベーション値をペナライズする学習自由解を提案する。
論文 参考訳(メタデータ) (2025-09-21T07:58:48Z) - MoiréXNet: Adaptive Multi-Scale Demoiréing with Linear Attention Test-Time Training and Truncated Flow Matching Prior [11.753823187605033]
本稿では,A Posteriori (MAP) 推定と高度な深層学習技術を統合することで,画像と映像のデシフティングを実現する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-19T00:15:07Z) - One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation [60.54811860967658]
FluxSRはフローマッチングモデルに基づく新しい一段階拡散リアルISRである。
まず,フロートラジェクトリ蒸留(FTD)を導入し,多段階のフローマッチングモデルを1段階のリアルISRに蒸留する。
第2に、画像リアリズムを改善し、生成画像の高周波アーティファクト問題に対処するために、テレビLPIPSを知覚的損失として提案する。
論文 参考訳(メタデータ) (2025-02-04T04:11:29Z) - Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。
我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。
我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文 参考訳(メタデータ) (2023-09-18T09:36:24Z) - BOOT: Data-free Distillation of Denoising Diffusion Models with
Bootstrapping [64.54271680071373]
拡散モデルは多様な画像を生成する優れた可能性を示している。
知識蒸留は、推論ステップの数を1つか数に減らすための治療法として最近提案されている。
本稿では,効率的なデータフリー蒸留アルゴリズムにより限界を克服するBOOTと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T20:30:55Z) - GSURE-Based Diffusion Model Training with Corrupted Data [35.56267114494076]
本稿では, 劣化データのみに基づく生成拡散モデルのための新しいトレーニング手法を提案する。
顔画像と磁気共鳴画像(MRI)の撮影技術について紹介する。
論文 参考訳(メタデータ) (2023-05-22T15:27:20Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。