Fugu-MT 論文翻訳(概要): Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting

論文の概要: Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting

arxiv url: http://arxiv.org/abs/2412.01682v3
Date: Sat, 14 Dec 2024 17:46:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-17 15:49:59.36481
Title: Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting
Title（参考訳）: 画像塗布のための異方性ガウス平滑化拡散モデル
Authors: Jacob Fein-Ashley, Benjamin Fein-Ashley,
Abstract要約: 本研究では,拡散モデルと異方性ガウススプラッティングを組み合わせ,局所構造とグローバルコンテキストの両方を効果的に捉える新しい塗装法を提案する。提案手法は最先端技術より優れ, 構造的整合性とテクスチャリアリズムを向上した視覚的可視性のある結果が得られる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Image inpainting is a fundamental task in computer vision, aiming to restore missing or corrupted regions in images realistically. While recent deep learning approaches have significantly advanced the state-of-the-art, challenges remain in maintaining structural continuity and generating coherent textures, particularly in large missing areas. Diffusion models have shown promise in generating high-fidelity images but often lack the structural guidance necessary for realistic inpainting. We propose a novel inpainting method that combines diffusion models with anisotropic Gaussian splatting to capture both local structures and global context effectively. By modeling missing regions using anisotropic Gaussian functions that adapt to local image gradients, our approach provides structural guidance to the diffusion-based inpainting network. The Gaussian splat maps are integrated into the diffusion process, enhancing the model's ability to generate high-fidelity and structurally coherent inpainting results. Extensive experiments demonstrate that our method outperforms state-of-the-art techniques, producing visually plausible results with enhanced structural integrity and texture realism.
Abstract（参考訳）: 画像の塗装はコンピュータビジョンの基本的な課題であり、画像の欠落した領域や破損した領域を現実的に復元することを目的としている。最近のディープラーニングアプローチは最先端を著しく進歩させているが、構造的連続性を維持し、コヒーレントなテクスチャを生成することの難しさは、特に大きな欠落した地域では依然として残っている。拡散モデルは高忠実度画像の生成において有望であるが、現実的な塗布に必要な構造的ガイダンスを欠いていることが多い。本研究では,拡散モデルと異方性ガウススプラッティングを組み合わせ,局所構造とグローバルコンテキストの両方を効果的に捉える新しい塗装法を提案する。局所像勾配に適応する異方性ガウス関数を用いて欠落領域をモデル化することにより,拡散型インパインティングネットワークの構造的ガイダンスを提供する。ガウススプレートマップは拡散過程に統合され、モデルが高忠実で構造的に整合した塗装結果を生成する能力を高める。広汎な実験により,本手法は最先端技術より優れ,構造的整合性とテクスチャリアリズムを向上した視覚的可視性の結果が得られた。

関連論文リスト

Knowledge-guided Complex Diffusion Model for PolSAR Image Classification in Contourlet Domain [58.46450049579116]
本稿では,Contourlet領域におけるPolSAR画像分類のための知識誘導複合拡散モデルを提案する。具体的には、まずデータを低周波サブバンドと高周波サブバンドに分解するためにContourlet変換を適用する。次に、低周波成分の統計特性をモデル化するために、知識誘導複合拡散ネットワークを設計する。
論文参考訳（メタデータ） (2025-07-08T04:50:28Z)
RichControl: Structure- and Appearance-Rich Training-Free Spatial Control for Text-to-Image Generation [16.038598998902767]
テキスト・ツー・イメージ(T2I)拡散モデルでは,テキスト・プロンプトから高品質な画像を生成することに成功した。本稿では,デノナイジングプロセスからインジェクションタイムステップを分離するフレキシブルな機能インジェクションフレームワークを提案する。提案手法は,多種多様なゼロショット条件付きシナリオにおける最先端性能を実現する。
論文参考訳（メタデータ） (2025-07-03T16:56:15Z)
ESDiff: Encoding Strategy-inspired Diffusion Model with Few-shot Learning for Color Image Inpainting [5.961957277931777]
画像インペイント(英: Image inpainting)とは、画像の欠落した領域や損傷領域を復元するために用いられる技法である。本稿では,カラー画像のインペイントのための数ショット学習を用いた符号化戦略インスピレーション拡散モデルを提案する。実験結果から,本手法は測定値において現在の手法を超えていることが示唆された。
論文参考訳（メタデータ） (2025-04-24T13:08:36Z)
From Missing Pieces to Masterpieces: Image Completion with Context-Adaptive Diffusion [98.31811240195324]
ConFillは、各拡散ステップで生成された画像とオリジナル画像の差を小さくする新しいフレームワークである。現行の手法より優れており、画像補完の新しいベンチマークが設定されている。
論文参考訳（メタデータ） (2025-04-19T13:40:46Z)
d-Sketch: Improving Visual Fidelity of Sketch-to-Image Translation with Pretrained Latent Diffusion Models without Retraining [18.73832646369506]
本稿では,大規模な拡散モデルの特徴一般化機能を利用したスケッチ・ツー・イメージ翻訳手法を提案する。実験結果から,提案手法は定性的,定量的なベンチマークにおいて既存の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2025-02-19T11:54:45Z)
Unpaired Deblurring via Decoupled Diffusion Model [55.21345354747609]
UID-Diffは,未知領域における劣化性能の向上を目的とした生成拡散モデルである。構造的特徴とぼかしパターン抽出器を別々に用いて, 抽出した特徴は, 合成データに対する教師付きデブロアリングタスクと教師なしのぼかし転送タスクに使用される。実世界のデータセットの実験では、UID-Diffが既存の最先端の手法よりも、ぼやけた除去と構造保存に優れていることが示されている。
論文参考訳（メタデータ） (2025-02-03T17:00:40Z)
InpDiffusion: Image Inpainting Localization via Conditional Diffusion Models [10.213390634031049]
現在のIIL法は2つの大きな課題に直面している。拡散モデルを用いた条件付きマスク生成タスクとしてIILを扱う新しいパラダイムを提案する。我々の手法であるInpDiffusionは、画像意味条件の統合によって強化された復調過程を利用して、予測を段階的に洗練する。
論文参考訳（メタデータ） (2025-01-06T07:32:12Z)
Edge-preserving noise for diffusion models [4.435514696080208]
既存の等方性モデルに対して一般化した新しいエッジ保存拡散モデルを提案する。モデルの生成過程はより高速に収束し, 対象の分布とより密に一致していることを示す。我々のエッジ保存拡散プロセスは、非条件画像生成における最先端のベースラインを一貫して上回る。
論文参考訳（メタデータ） (2024-10-02T13:29:52Z)
Coherent and Multi-modality Image Inpainting via Latent Space Optimization [61.99406669027195]
PILOT(intextbfPainting vtextbfIa textbfOptextbfTimization)は、新しいテキストセマンティック中央化とテキストセマンティック保存損失に基づく最適化手法である。本手法は,背景とのコヒーレンスを維持しつつ,ユーザが提供するプロンプトに対して高い忠実度を示す塗装領域を生成できる潜時空間を探索する。
論文参考訳（メタデータ） (2024-07-10T19:58:04Z)
Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。 CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。 DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文参考訳（メタデータ） (2023-10-11T12:46:11Z)
Improving Few-shot Image Generation by Structural Discrimination and Textural Modulation [10.389698647141296]
画像生成の目的は、このカテゴリからいくつかの画像が与えられた場合、あるカテゴリに対して可塑性で多様な画像を生成することである。既存のアプローチでは、異なる画像をグローバルに補間するか、事前に定義された係数で局所表現を融合する。本稿では,内部局所表現に外部意味信号を注入する新しいメカニズムを提案する。
論文参考訳（メタデータ） (2023-08-30T16:10:21Z)
Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。 2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文参考訳（メタデータ） (2022-11-22T18:59:50Z)
A Structure-Guided Diffusion Model for Large-Hole Image Completion [85.61681358977266]
画像中の大きな穴を埋める構造誘導拡散モデルを開発した。本手法は,最先端の手法と比較して,優れた,あるいは同等の視覚的品質を実現する。
論文参考訳（メタデータ） (2022-11-18T18:59:01Z)
DELAD: Deep Landweber-guided deconvolution with Hessian and sparse prior [0.22940141855172028]
本稿では,古典的反復法をディープラーニングアプリケーションに組み込んだ非盲検画像デコンボリューションモデルを提案する。このアルゴリズムは、トレーニング可能な畳み込み層と統合され、復元された画像構造と詳細を強化する。
論文参考訳（メタデータ） (2022-09-30T11:15:03Z)
RSINet: Inpainting Remotely Sensed Images Using Triple GAN Framework [13.613245876782367]
本稿では,エッジ,色,テクスチャなどの画像の各側面に個別に焦点をあてる新しい塗装法を提案する。個々のGANには、スペクトルと空間的特徴を明示的に抽出するアテンション機構も組み込まれている。キャンバス上の2つのよく知られたリモートセンシングデータセット、Open Cities AIとEarthで、当社のモデルと過去の技術モデルの評価を行った。
論文参考訳（メタデータ） (2022-02-12T05:19:37Z)
DWDN: Deep Wiener Deconvolution Network for Non-Blind Image Deblurring [66.91879314310842]
本稿では,古典的なWienerデコンボリューションフレームワークを学習深い特徴と統合することにより,特徴空間における明示的なデコンボリューションプロセスを提案する。マルチスケールのカスケード機能改善モジュールは、分離された深い特徴から退色画像を予測する。提案したDeep Wienerデコンボリューションネットワークは,目に見える成果物が少なく,かつ,最先端の非盲点画像デコンボリューション手法を広いマージンで定量的に上回っていることを示す。
論文参考訳（メタデータ） (2021-03-18T00:38:11Z)
Efficient texture-aware multi-GAN for image inpainting [5.33024001730262]
近年のGAN (Generative Adversarial Network) のインペイント手法は顕著に改善されている。本稿では,性能とレンダリング効率の両方を改善するマルチGANアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-09-30T14:58:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。