論文の概要: Adaptive Domain Shift in Diffusion Models for Cross-Modality Image Translation
- arxiv url: http://arxiv.org/abs/2601.18623v1
- Date: Mon, 26 Jan 2026 16:00:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.91766
- Title: Adaptive Domain Shift in Diffusion Models for Cross-Modality Image Translation
- Title(参考訳): クロスモーダル画像変換のための拡散モデルにおける適応的領域シフト
- Authors: Zihao Wang, Yuzhou Chen, Shaogang Ren,
- Abstract要約: 画像の相互変換は不安定で非効率である。
標準拡散アプローチはドメイン間の1つの大域的線型移動に依存することが多い。
生成プロセスに直接ドメインシフトダイナミクスを組み込む。
- 参考スコア(独自算出の注目度): 35.54089670586124
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cross-modal image translation remains brittle and inefficient. Standard diffusion approaches often rely on a single, global linear transfer between domains. We find that this shortcut forces the sampler to traverse off-manifold, high-cost regions, inflating the correction burden and inviting semantic drift. We refer to this shared failure mode as fixed-schedule domain transfer. In this paper, we embed domain-shift dynamics directly into the generative process. Our model predicts a spatially varying mixing field at every reverse step and injects an explicit, target-consistent restoration term into the drift. This in-step guidance keeps large updates on-manifold and shifts the model's role from global alignment to local residual correction. We provide a continuous-time formulation with an exact solution form and derive a practical first-order sampler that preserves marginal consistency. Empirically, across translation tasks in medical imaging, remote sensing, and electroluminescence semantic mapping, our framework improves structural fidelity and semantic consistency while converging in fewer denoising steps.
- Abstract(参考訳): 画像の相互変換は不安定で非効率である。
標準拡散アプローチはドメイン間の1つの大域的線型移動に依存することが多い。
このショートカットにより, サンプルは1次元の高コスト領域を横切ることができ, 補正負担を膨らませ, セマンティックドリフトを誘導できることがわかった。
この共有障害モードを固定スケジュールドメイン転送と呼ぶ。
本稿では,生成過程に直接ドメインシフトダイナミクスを組み込む。
本モデルでは, 逆ステップ毎に空間的に変化する混合場を予測し, ドリフトに明示的かつ目標整合性回復項を注入する。
この段階的なガイダンスは、大規模な更新をmanifoldで維持し、モデルの役割をグローバルアライメントから局所的残差補正にシフトさせる。
厳密な解形式を持つ連続時間定式化を行い、限界整合性を保持する実用的な一階サンプリング器を導出する。
医療画像、リモートセンシング、エレクトロルミネッセンス・セマンティック・マッピングにおける翻訳作業において、我々のフレームワークは、より少ない復調ステップで収束しながら、構造的忠実性とセマンティック・一貫性を向上させる。
関連論文リスト
- On Exact Editing of Flow-Based Diffusion Models [97.0633397035926]
本研究では,フローベース編集を既知ソースによって駆動される分散変換問題として再構成する条件付き速度補正(CVC)を提案する。
CVCは、双対パースペクティブな速度変換機構を導入することにより、分配間変換における速度の役割を再考する。
我々は,CVCが優れた忠実度,セマンティックアライメント,多種多様なタスクに対する信頼性の高い編集動作を一貫して達成していることを示す。
論文 参考訳(メタデータ) (2025-12-30T06:29:20Z) - Simulating Distribution Dynamics: Liquid Temporal Feature Evolution for Single-Domain Generalized Object Detection [58.25418970608328]
Single-Domain Generalized Object Detection (Single-DGOD)は、あるソースドメインで訓練された検出器を複数の未知のドメインに転送することを目的としている。
シングルDGODの既存の方法は通常、データの多様性を拡大するために離散的なデータ拡張や静的摂動法に依存している。
そこで本研究では,ソース領域から潜伏分布のシミュレーションに至るまでの機能の進化をシミュレートする手法を提案する。
論文 参考訳(メタデータ) (2025-11-13T03:10:39Z) - Multimodal LLM-Guided Semantic Correction in Text-to-Image Diffusion [52.315729095824906]
MLLM Semantic-Corrected Ping-Pong-Ahead Diffusion (PPAD) は,マルチモーダル大言語モデル(MLLM)を推論中の意味的オブザーバとして導入する新しいフレームワークである。
中間世代をリアルタイムに分析し、潜在意味的不整合を識別し、フィードバックを制御可能な信号に変換し、残りの認知ステップを積極的に導く。
大規模な実験ではPPADの大幅な改善が示されている。
論文 参考訳(メタデータ) (2025-05-26T14:42:35Z) - Improving Diffusion-based Image Translation using Asymmetric Gradient
Guidance [51.188396199083336]
非対称勾配法の適用により拡散サンプリングの逆過程を導出する手法を提案する。
我々のモデルの適応性は、画像融合モデルと潜時拡散モデルの両方で実装できる。
実験により,本手法は画像翻訳タスクにおいて,様々な最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-07T12:56:56Z) - Smooth image-to-image translations with latent space interpolations [64.8170758294427]
マルチドメインイメージ・トゥ・イメージ(I2I)変換は、ターゲットドメインのスタイルに応じてソースイメージを変換することができる。
我々の正規化技術は、最先端のI2I翻訳を大きなマージンで改善できることを示す。
論文 参考訳(メタデータ) (2022-10-03T11:57:30Z) - MIDMs: Matching Interleaved Diffusion Models for Exemplar-based Image
Translation [29.03892463588357]
マッチング型インターリーブド拡散モデル (MIDM) と呼ばれる, 画像翻訳のための新しい手法を提案する。
拡散に基づくマッチング・アンド・ジェネレーション・フレームワークを定式化し、ドメイン間マッチングと拡散ステップを潜時空間でインターリーブする。
拡散過程の信頼性を向上させるため,サイクル整合性を用いた信頼度対応プロセスの設計を行い,信頼度の高い領域のみを考える。
論文 参考訳(メタデータ) (2022-09-22T14:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。