Fugu-MT 論文翻訳(概要): SatDM: Synthesizing Realistic Satellite Image with Semantic Layout Conditioning using Diffusion Models

論文の概要: SatDM: Synthesizing Realistic Satellite Image with Semantic Layout Conditioning using Diffusion Models

arxiv url: http://arxiv.org/abs/2309.16812v1
Date: Thu, 28 Sep 2023 19:39:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-02 16:24:58.204883
Title: SatDM: Synthesizing Realistic Satellite Image with Semantic Layout Conditioning using Diffusion Models
Title（参考訳）: SatDM:拡散モデルを用いた意味的レイアウト条件付き実写衛星画像の合成
Authors: Orkhan Baghirli, Hamid Askarov, Imran Ibrahimli, Ismat Bakhishov, Nabi Nabiyev
Abstract要約: Denoising Diffusion Probabilistic Models (DDPM) は意味的レイアウトから現実的なイメージを合成する上で大きな可能性を証明している。本稿では,セマンティックマップを用いて高品質で多様な衛星画像を生成する条件付きDDPMモデルを提案する。提案モデルの有効性は,本研究の文脈内で導入した詳細なラベル付きデータセットを用いて検証する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Deep learning models in the Earth Observation domain heavily rely on the availability of large-scale accurately labeled satellite imagery. However, obtaining and labeling satellite imagery is a resource-intensive endeavor. While generative models offer a promising solution to address data scarcity, their potential remains underexplored. Recently, Denoising Diffusion Probabilistic Models (DDPMs) have demonstrated significant promise in synthesizing realistic images from semantic layouts. In this paper, a conditional DDPM model capable of taking a semantic map and generating high-quality, diverse, and correspondingly accurate satellite images is implemented. Additionally, a comprehensive illustration of the optimization dynamics is provided. The proposed methodology integrates cutting-edge techniques such as variance learning, classifier-free guidance, and improved noise scheduling. The denoising network architecture is further complemented by the incorporation of adaptive normalization and self-attention mechanisms, enhancing the model's capabilities. The effectiveness of our proposed model is validated using a meticulously labeled dataset introduced within the context of this study. Validation encompasses both algorithmic methods such as Frechet Inception Distance (FID) and Intersection over Union (IoU), as well as a human opinion study. Our findings indicate that the generated samples exhibit minimal deviation from real ones, opening doors for practical applications such as data augmentation. We look forward to further explorations of DDPMs in a wider variety of settings and data modalities. An open-source reference implementation of the algorithm and a link to the benchmarked dataset are provided at https://github.com/obaghirli/syn10-diffusion.
Abstract（参考訳）: 地球観測領域のディープラーニングモデルは、大規模正確にラベル付けされた衛星画像の可用性に大きく依存している。しかし、衛星画像の取得とラベル付けは資源集約的な取り組みである。生成モデルはデータの不足に対処するための有望なソリューションを提供するが、そのポテンシャルはいまだ探索されていない。近年,DDPM(Denoising Diffusion Probabilistic Models)は,意味的レイアウトから現実的なイメージを合成する上で,大きな可能性を示唆している。本稿では,意味マップを取得でき,高品質で多彩な衛星画像を生成する条件付きddpmモデルを実装した。さらに、最適化ダイナミクスの包括的なイラストを提供する。提案手法は分散学習,分類器フリーガイダンス,ノイズスケジューリングの改善といった最先端技術を統合する。雑音化ネットワークアーキテクチャは、適応正規化と自己アテンション機構の導入によってさらに補完され、モデルの能力を高める。本研究の文脈で導入した注意深いラベル付きデータセットを用いて,提案モデルの有効性を検証する。検証には、Frechet Inception Distance(FID)やIntersection over Union(IoU)といったアルゴリズム手法と、人間の意見研究の両方が含まれる。以上の結果から,生成した試料は実物からの偏差が最小であり,データ拡張などの実用的応用への扉が開けていることが示唆された。 DDPMのより広範な設定とデータモダリティに関するさらなる調査を楽しみにしています。このアルゴリズムのオープンソースリファレンス実装とベンチマークデータセットへのリンクはhttps://github.com/obaghirli/syn10-diffusionで提供されている。

関連論文リスト

Zero-Shot Image Anomaly Detection Using Generative Foundation Models [2.241618130319058]
本研究は,意味的異常検出のための基礎的ツールとしてスコアベース生成モデルの利用について検討する。スタインスコアの誤差を解析することにより,各ターゲットデータセットの再学習を必要とせず,異常サンプルを識別する新しい手法を提案する。このアプローチは最先端よりも改善され、ひとつのデータセット — CelebA -- 上で単一のモデルをトレーニングすることに依存しています。
論文参考訳（メタデータ） (2025-07-30T13:56:36Z)
Deep Diffusion Models and Unsupervised Hyperspectral Unmixing for Realistic Abundance Map Synthesis [0.2812395851874055]
我々のフレームワークは、ブラインド線形ハイパースペクトルアンミックスと最先端拡散モデルを統合し、合成アブリダンスマップの現実性と多様性を高める。我々は、地球観測のためのPRISMA宇宙ミッションの実際のハイパースペクトル画像を用いて、我々のアプローチを検証する。
論文参考訳（メタデータ） (2025-06-16T13:42:51Z)
Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文参考訳（メタデータ） (2025-05-22T10:01:59Z)
Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model [1.9746060146273674]
本稿では,新しい言語インフォームドハイパースペクトル画像合成法であるTxt2HSI-LDM(VAE)を提案する。ハイパースペクトルデータの高次元性に対処するため、普遍変分オートエンコーダ(VAE)は、データを低次元の潜在空間にマッピングするように設計されている。 VAEは、拡散モデルによって生成された潜時空間から言語条件を入力としてHSIをデコードする。
論文参考訳（メタデータ） (2025-02-27T02:35:49Z)
Synthetic Augmentation for Anatomical Landmark Localization using DDPMs [0.22499166814992436]
拡散型生成モデルは近年,高品質な合成画像を生成する能力に注目が集まっている。ランドマークマッチングのためのマルコフランダムフィールド(MRF)モデルと統計的形状モデル(SSM)を用いて,生成画像の品質を評価する新しい手法を提案する。
論文参考訳（メタデータ） (2024-10-16T12:09:38Z)
Towards Model-Agnostic Dataset Condensation by Heterogeneous Models [13.170099297210372]
我々は,クロスモデル相互作用により,普遍的に適用可能なコンデンサ画像を生成する新しい手法を開発した。モデルのコントリビューションのバランスとセマンティックな意味の密接な維持により,本手法は,モデル固有凝縮画像に関連する制約を克服する。
論文参考訳（メタデータ） (2024-09-22T17:13:07Z)
Spatially-Aware Diffusion Models with Cross-Attention for Global Field Reconstruction with Sparse Observations [1.371691382573869]
フィールド再構成タスクにおけるスコアベース拡散モデルの開発と拡張を行う。本研究では,観測領域と観測領域の間のトラクタブルマッピングを構築するための条件符号化手法を提案する。本研究では, モデルが再現可能かどうかを把握し, 融合結果の精度を向上する能力を示す。
論文参考訳（メタデータ） (2024-08-30T19:46:23Z)
SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文参考訳（メタデータ） (2024-03-25T10:30:22Z)
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文参考訳（メタデータ） (2024-03-20T04:58:03Z)
Diffusion Models for Interferometric Satellite Aperture Radar [73.01013149014865]
確率拡散モデル (Probabilistic Diffusion Models, PDMs) は、最近、非常に有望な生成モデルのクラスとして登場した。ここでは、PDMを活用して、レーダーベースの衛星画像データセットを複数生成する。 PDMは複雑で現実的な構造を持つ画像を生成することに成功したが、サンプリング時間は依然として問題である。
論文参考訳（メタデータ） (2023-08-31T16:26:17Z)
Insights into Closed-form IPM-GAN Discriminator Guidance for Diffusion Modeling [11.68361062474064]
本稿では,GAN判別器がLangevinに基づくサンプリングに与える影響を理論的に解析する枠組みを提案する。提案手法は既存の加速拡散技術と組み合わせて潜在空間画像生成を改善することができることを示す。
論文参考訳（メタデータ） (2023-06-02T16:24:07Z)
CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文参考訳（メタデータ） (2023-05-29T07:49:44Z)
Boosting Human-Object Interaction Detection with Text-to-Image Diffusion Model [22.31860516617302]
本稿では,事前学習したテキスト画像拡散モデルに基づく新しいHOI検出方式であるDiffHOIを紹介する。 HOIデータセットのギャップを埋めるために、クラスバランス、大規模、高多様性の合成データセットであるSynHOIを提案する。実験により、DiffHOIは通常の検出(41.50 mAP)とゼロショット検出において、最先端の技術を著しく上回っていることが示された。
論文参考訳（メタデータ） (2023-05-20T17:59:23Z)
Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文参考訳（メタデータ） (2022-06-30T18:31:51Z)
Deep Equilibrium Assisted Block Sparse Coding of Inter-dependent Signals: Application to Hyperspectral Imaging [71.57324258813675]
相互依存信号のデータセットは、列が強い依存を示す行列として定義される。ニューラルネットワークは、事前に構造として機能し、基礎となる信号相互依存性を明らかにするために使用される。ディープ・アンローリングとディープ・平衡に基づくアルゴリズムが開発され、高度に解釈可能で簡潔なディープ・ラーニング・ベース・アーキテクチャを形成する。
論文参考訳（メタデータ） (2022-03-29T21:00:39Z)
Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文参考訳（メタデータ） (2020-12-16T21:46:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。