論文の概要: Stable Diffusion For Aerial Object Detection
- arxiv url: http://arxiv.org/abs/2311.12345v1
- Date: Tue, 21 Nov 2023 04:38:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 02:09:49.759179
- Title: Stable Diffusion For Aerial Object Detection
- Title(参考訳): 空中物体検出のための安定拡散
- Authors: Yanan Jian, Fuxun Yu, Simranjit Singh, Dimitrios Stamoulis
- Abstract要約: 本研究では,空中画像に適した合成データ拡張フレームワークを提案する。
セマンティックギャップを橋渡し、低ランク適応(LORA)で拡散モデルを微調整し、徹底的な再トレーニングを回避し、最後に、背景を持つ合成オブジェクトを構成する Copy-Paste 法を含む。
- 参考スコア(独自算出の注目度): 4.014524824655107
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aerial object detection is a challenging task, in which one major obstacle
lies in the limitations of large-scale data collection and the long-tail
distribution of certain classes. Synthetic data offers a promising solution,
especially with recent advances in diffusion-based methods like stable
diffusion (SD). However, the direct application of diffusion methods to aerial
domains poses unique challenges: stable diffusion's optimization for rich
ground-level semantics doesn't align with the sparse nature of aerial objects,
and the extraction of post-synthesis object coordinates remains problematic. To
address these challenges, we introduce a synthetic data augmentation framework
tailored for aerial images. It encompasses sparse-to-dense region of interest
(ROI) extraction to bridge the semantic gap, fine-tuning the diffusion model
with low-rank adaptation (LORA) to circumvent exhaustive retraining, and
finally, a Copy-Paste method to compose synthesized objects with backgrounds,
providing a nuanced approach to aerial object detection through synthetic data.
- Abstract(参考訳): 空中物体検出は、大規模なデータ収集の限界と特定のクラスの長い尾の分布に1つの大きな障害がある、難しい課題である。
合成データは、特に安定拡散(SD)のような拡散に基づく手法の最近の進歩において、有望な解を提供する。
しかし、拡散法の航空領域への直接適用は、安定拡散のリッチな地上レベルのセマンティクスに対する最適化は、空中物体のスパースな性質と一致せず、合成後の物体座標の抽出には問題が残る。
これらの課題に対処するために,空中画像に適した合成データ拡張フレームワークを提案する。
セマンティックギャップを橋渡しし、低ランク適応(LORA)で拡散モデルを微調整し、徹底的な再トレーニングを回避し、最後に、背景を持つ合成オブジェクトを構成する Copy-Paste 法を適用し、合成データによる空中物体検出へのニュアンスなアプローチを提供する。
関連論文リスト
- Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - SatDM: Synthesizing Realistic Satellite Image with Semantic Layout
Conditioning using Diffusion Models [0.0]
Denoising Diffusion Probabilistic Models (DDPM) は意味的レイアウトから現実的なイメージを合成する上で大きな可能性を証明している。
本稿では,セマンティックマップを用いて高品質で多様な衛星画像を生成する条件付きDDPMモデルを提案する。
提案モデルの有効性は,本研究の文脈内で導入した詳細なラベル付きデータセットを用いて検証する。
論文 参考訳(メタデータ) (2023-09-28T19:39:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Head Rotation in Denoising Diffusion Models [0.0]
本研究は,最も複雑な編集作業の1つである顔の回転に着目した。
提案手法は,データセットの潜在表現の雲を近似するトラジェクトリの計算を利用する。
特定のトラジェクトリは、ソース画像と重要な属性を共有するデータのサブセットに解析を限定することで得られる。
論文 参考訳(メタデータ) (2023-08-11T10:14:22Z) - LafitE: Latent Diffusion Model with Feature Editing for Unsupervised
Multi-class Anomaly Detection [12.596635603629725]
我々は,通常のデータのみにアクセス可能な場合に,複数のクラスに属するオブジェクトから異常を検出する統一モデルを開発した。
まず、生成的アプローチについて検討し、再構成のための潜伏拡散モデルについて検討する。
「拡散モデルの入力特徴空間を修正し、アイデンティティショートカットをさらに緩和する特徴編集戦略を導入する。」
論文 参考訳(メタデータ) (2023-07-16T14:41:22Z) - SF-FSDA: Source-Free Few-Shot Domain Adaptive Object Detection with
Efficient Labeled Data Factory [94.11898696478683]
ドメイン適応オブジェクト検出は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしのターゲットドメインのパフォーマンスを改善することを目的としています。
本研究では,SF-FSDA という名称のソースフリーおよび少数ショット条件下で,より実用的で困難な領域適応型オブジェクト検出問題を提案し,検討する。
論文 参考訳(メタデータ) (2023-06-07T12:34:55Z) - Decomposed Diffusion Sampler for Accelerating Large-Scale Inverse
Problems [64.29491112653905]
本稿では, 拡散サンプリング法とクリロフ部分空間法を相乗的に組み合わせた, 新規で効率的な拡散サンプリング手法を提案する。
具体的には、ツイーディの公式による分母化標本における接空間がクリロフ部分空間を成すならば、その分母化データによるCGは、接空間におけるデータの整合性更新を確実に維持する。
提案手法は,従来の最先端手法よりも80倍以上高速な推論時間を実現する。
論文 参考訳(メタデータ) (2023-03-10T07:42:49Z) - Empowering Diffusion Models on the Embedding Space for Text Generation [38.664533078347304]
埋め込み空間とデノナイジングモデルの両方で直面する最適化課題について検討する。
データ分散は埋め込みにおいて学習可能であり、埋め込み空間の崩壊と不安定なトレーニングにつながる可能性がある。
以上の解析に基づいて,Transformerに基づく埋め込み拡散モデルであるDifformerを提案する。
論文 参考訳(メタデータ) (2022-12-19T12:44:25Z) - Few Shot Generative Model Adaption via Relaxed Spatial Structural
Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。
実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。
本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文 参考訳(メタデータ) (2022-03-06T14:26:25Z) - Extreme Learning Machine for the Characterization of Anomalous Diffusion
from Single Trajectories [0.0]
エクストリームラーニングマシンとフィーチャーエンジニアリング(AnDi-ELM)を組み合わせることで、AnDiチャレンジのタスクに取り組むためのシンプルなアプローチを説明します。
この手法は,計算資源に制限のある簡単な実装と高速な訓練時間を提供しながら,良好な性能を達成する。
論文 参考訳(メタデータ) (2021-05-06T11:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。