Fugu-MT 論文翻訳(概要): Generalized Consistency Trajectory Models for Image Manipulation

論文の概要: Generalized Consistency Trajectory Models for Image Manipulation

arxiv url: http://arxiv.org/abs/2403.12510v2
Date: Mon, 07 Oct 2024 10:31:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-03 22:44:13.611658
Title: Generalized Consistency Trajectory Models for Image Manipulation
Title（参考訳）: 画像操作のための一般化された一貫性軌道モデル
Authors: Beomsu Kim, Jaemin Kim, Jeongsol Kim, Jong Chul Ye,
Abstract要約: 拡散モデル(DM)は、画像編集や復元などの応用と同様に、無条件生成において優れている。本研究の目的は、一般化されたCTM(GCTM)を提案することによって、整合性軌道モデル(CTM)の完全なポテンシャルを解放することである。本稿では,GCTMの設計空間について論じ,画像から画像への変換,復元,編集など,様々な画像操作タスクにおいて有効性を示す。
参考スコア（独自算出の注目度）: 59.576781858809355
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Diffusion models (DMs) excel in unconditional generation, as well as on applications such as image editing and restoration. The success of DMs lies in the iterative nature of diffusion: diffusion breaks down the complex process of mapping noise to data into a sequence of simple denoising tasks. Moreover, we are able to exert fine-grained control over the generation process by injecting guidance terms into each denoising step. However, the iterative process is also computationally intensive, often taking from tens up to thousands of function evaluations. Although consistency trajectory models (CTMs) enable traversal between any time points along the probability flow ODE (PFODE) and score inference with a single function evaluation, CTMs only allow translation from Gaussian noise to data. This work aims to unlock the full potential of CTMs by proposing generalized CTMs (GCTMs), which translate between arbitrary distributions via ODEs. We discuss the design space of GCTMs and demonstrate their efficacy in various image manipulation tasks such as image-to-image translation, restoration, and editing.
Abstract（参考訳）: 拡散モデル(DM)は、画像編集や復元などの応用と同様に、無条件生成において優れている。拡散は、ノイズをデータにマッピングする複雑な過程を、単純な復調タスクの列に分解する。さらに,各認知ステップに誘導項を注入することにより,生成プロセスのきめ細かい制御を行うことができる。しかし、反復過程も計算集約的であり、しばしば数万から数千の関数評価を取る。整合性軌道モデル(CTM)は、確率フローODE(PFODE)に沿った任意の時間点間のトラバースを可能にし、単一関数評価によるスコア推定を可能にするが、CTMはガウスノイズからデータへの変換のみを可能にする。本研究の目的は、一般化されたCTM(GCTM)を提案し、ODEを介して任意の分布を変換することで、CTMの潜在能力を最大限に活用することである。本稿では,GCTMの設計空間について論じ,画像から画像への変換,復元,編集など,様々な画像操作タスクにおいて有効性を示す。

関連論文リスト

Measurement Score-Based Diffusion Model [5.82978411250693]
測定スコアベース拡散モデル(MSM)は,雑音とサブサンプル測定のみを用いて部分的測定スコアを学習する新しいフレームワークである。 MSMは高品質な画像を生成し、逆問題の解決を可能にする。
論文参考訳（メタデータ） (2025-05-17T05:33:47Z)
Binary Diffusion Probabilistic Model [4.671529048076975]
本稿では,バイナリデータ表現に最適化された新しい生成モデルであるバイナリ拡散確率モデル(BDPM)を紹介する。 BDPMは、画像をビットプレーンに分解し、XORベースのノイズ変換を採用することでこの問題に対処する。このアプローチは、正確なノイズ制御と計算効率の良い推論を可能にし、計算コストを大幅に削減し、モデル収束を改善する。
論文参考訳（メタデータ） (2025-01-23T18:52:47Z)
Improving Denoising Diffusion Probabilistic Models via Exploiting Shared Representations [5.517338199249029]
SR-DDPMはノイズ拡散過程を逆転することで高品質な画像を生成する生成モデルのクラスである。多様なデータ分布の類似性を利用して、画像の品質を損なうことなく、複数のタスクにスケールできる。提案手法を標準画像データセット上で評価し、FIDとSSIMの指標で条件付きDDPMと条件付きDDPMの両方より優れていることを示す。
論文参考訳（メタデータ） (2023-11-27T22:30:26Z)
Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文参考訳（メタデータ） (2023-09-18T09:36:24Z)
Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。本稿では,階層型統合拡散モデル(HI-Diff)を提案する。人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (2023-05-22T12:18:20Z)
Markup-to-Image Diffusion Models with Scheduled Sampling [111.30188533324954]
画像生成の最近の進歩に基づき,画像にマークアップを描画するためのデータ駆動型アプローチを提案する。このアプローチは拡散モデルに基づいており、デノナイジング操作のシーケンスを用いてデータの分布をパラメータ化する。数式(La)、テーブルレイアウト(HTML)、シート音楽(LilyPond)、分子画像(SMILES)の4つのマークアップデータセットの実験を行った。
論文参考訳（メタデータ） (2022-10-11T04:56:12Z)
Image Generation with Multimodal Priors using Denoising Diffusion Probabilistic Models [54.1843419649895]
このタスクを達成するために生成モデルを使用する際の大きな課題は、すべてのモダリティと対応する出力を含むペアデータの欠如である。本稿では,拡散確率的合成モデルに基づく多モデル先行画像生成手法を提案する。
論文参考訳（メタデータ） (2022-06-10T12:23:05Z)
The Swiss Army Knife for Image-to-Image Translation: Multi-Task Diffusion Models [0.8999666725996974]
本研究では,暗黙的拡散モデルを用いた画像から画像への変換手法を構築した。回帰タスクを用いて顔画像の老化過程をシミュレートするために本手法を適用した。また,脳MRI画像の正常なスライスにおいて,所望の部位に腫瘍を塗布するためにセグメンテーションモデルを用いた。
論文参考訳（メタデータ） (2022-04-06T07:52:06Z)
Denoising Diffusion Restoration Models [110.1244240726802]
Denoising Diffusion Restoration Models (DDRM) は効率的で教師なしの後方サンプリング手法である。 DDRMの汎用性を、超高解像度、デブロアリング、インペイント、カラー化のためにいくつかの画像データセットに示す。
論文参考訳（メタデータ） (2022-01-27T20:19:07Z)
Score-based diffusion models for accelerated MRI [35.3148116010546]
本研究では,画像中の逆問題を容易に解けるような条件分布からデータをサンプリングする方法を提案する。我々のモデルは、訓練のためにのみ等級画像を必要とするが、複雑な値のデータを再構成することができ、さらに並列画像まで拡張できる。
論文参考訳（メタデータ） (2021-10-08T08:42:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。