論文の概要: Stable Diffusion For Aerial Object Detection
- arxiv url: http://arxiv.org/abs/2311.12345v1
- Date: Tue, 21 Nov 2023 04:38:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 02:09:49.759179
- Title: Stable Diffusion For Aerial Object Detection
- Title(参考訳): 空中物体検出のための安定拡散
- Authors: Yanan Jian, Fuxun Yu, Simranjit Singh, Dimitrios Stamoulis
- Abstract要約: 本研究では,空中画像に適した合成データ拡張フレームワークを提案する。
セマンティックギャップを橋渡し、低ランク適応(LORA)で拡散モデルを微調整し、徹底的な再トレーニングを回避し、最後に、背景を持つ合成オブジェクトを構成する Copy-Paste 法を含む。
- 参考スコア(独自算出の注目度): 4.014524824655107
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aerial object detection is a challenging task, in which one major obstacle
lies in the limitations of large-scale data collection and the long-tail
distribution of certain classes. Synthetic data offers a promising solution,
especially with recent advances in diffusion-based methods like stable
diffusion (SD). However, the direct application of diffusion methods to aerial
domains poses unique challenges: stable diffusion's optimization for rich
ground-level semantics doesn't align with the sparse nature of aerial objects,
and the extraction of post-synthesis object coordinates remains problematic. To
address these challenges, we introduce a synthetic data augmentation framework
tailored for aerial images. It encompasses sparse-to-dense region of interest
(ROI) extraction to bridge the semantic gap, fine-tuning the diffusion model
with low-rank adaptation (LORA) to circumvent exhaustive retraining, and
finally, a Copy-Paste method to compose synthesized objects with backgrounds,
providing a nuanced approach to aerial object detection through synthetic data.
- Abstract(参考訳): 空中物体検出は、大規模なデータ収集の限界と特定のクラスの長い尾の分布に1つの大きな障害がある、難しい課題である。
合成データは、特に安定拡散(SD)のような拡散に基づく手法の最近の進歩において、有望な解を提供する。
しかし、拡散法の航空領域への直接適用は、安定拡散のリッチな地上レベルのセマンティクスに対する最適化は、空中物体のスパースな性質と一致せず、合成後の物体座標の抽出には問題が残る。
これらの課題に対処するために,空中画像に適した合成データ拡張フレームワークを提案する。
セマンティックギャップを橋渡しし、低ランク適応(LORA)で拡散モデルを微調整し、徹底的な再トレーニングを回避し、最後に、背景を持つ合成オブジェクトを構成する Copy-Paste 法を適用し、合成データによる空中物体検出へのニュアンスなアプローチを提供する。
関連論文リスト
- Diffusion Suction Grasping with Large-Scale Parcel Dataset [6.112197264635304]
提案するParcel-Suction-Datasetは,4億1000万の高精度な吸引把握ポーズを備えた,25万の散布シーンを含む大規模合成データセットである。
このデータセットは、最適吸引グリップの効率的な生成を可能にする新しい幾何サンプリングアルゴリズムによって生成される。
また、条件生成タスクとして、吸引把握予測を再構成する革新的なフレームワークであるDiffusion-Suctionを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:09:11Z) - Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.45019514036948]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。
連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-23T21:27:19Z) - Anomaly detection using Diffusion-based methods [15.049468347670421]
本稿では,拡散モデルによる異常検出の有用性について検討する。
コンパクトデータセットと高解像度データセットの両方における偏差を識別する効果に重点を置いている。
論文 参考訳(メタデータ) (2024-12-10T14:17:23Z) - Diffusion State-Guided Projected Gradient for Inverse Problems [82.24625224110099]
逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。
DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。
DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文 参考訳(メタデータ) (2024-10-04T14:26:54Z) - Spatially-Aware Diffusion Models with Cross-Attention for Global Field Reconstruction with Sparse Observations [1.371691382573869]
フィールド再構成タスクにおけるスコアベース拡散モデルの開発と拡張を行う。
本研究では,観測領域と観測領域の間のトラクタブルマッピングを構築するための条件符号化手法を提案する。
本研究では, モデルが再現可能かどうかを把握し, 融合結果の精度を向上する能力を示す。
論文 参考訳(メタデータ) (2024-08-30T19:46:23Z) - Hierarchical Features Matter: A Deep Exploration of GAN Priors for Improved Dataset Distillation [51.44054828384487]
階層的生成潜在蒸留(H-GLaD)と呼ばれる新しいパラメータ化法を提案する。
本手法はGAN内の階層層を系統的に探索する。
さらに,合成データセット評価に伴う計算負担を軽減するために,新しいクラス関連特徴距離尺度を導入する。
論文 参考訳(メタデータ) (2024-06-09T09:15:54Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - SatDM: Synthesizing Realistic Satellite Image with Semantic Layout
Conditioning using Diffusion Models [0.0]
Denoising Diffusion Probabilistic Models (DDPM) は意味的レイアウトから現実的なイメージを合成する上で大きな可能性を証明している。
本稿では,セマンティックマップを用いて高品質で多様な衛星画像を生成する条件付きDDPMモデルを提案する。
提案モデルの有効性は,本研究の文脈内で導入した詳細なラベル付きデータセットを用いて検証する。
論文 参考訳(メタデータ) (2023-09-28T19:39:13Z) - SF-FSDA: Source-Free Few-Shot Domain Adaptive Object Detection with
Efficient Labeled Data Factory [94.11898696478683]
ドメイン適応オブジェクト検出は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしのターゲットドメインのパフォーマンスを改善することを目的としています。
本研究では,SF-FSDA という名称のソースフリーおよび少数ショット条件下で,より実用的で困難な領域適応型オブジェクト検出問題を提案し,検討する。
論文 参考訳(メタデータ) (2023-06-07T12:34:55Z) - Few Shot Generative Model Adaption via Relaxed Spatial Structural
Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。
実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。
本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文 参考訳(メタデータ) (2022-03-06T14:26:25Z) - Extreme Learning Machine for the Characterization of Anomalous Diffusion
from Single Trajectories [0.0]
エクストリームラーニングマシンとフィーチャーエンジニアリング(AnDi-ELM)を組み合わせることで、AnDiチャレンジのタスクに取り組むためのシンプルなアプローチを説明します。
この手法は,計算資源に制限のある簡単な実装と高速な訓練時間を提供しながら,良好な性能を達成する。
論文 参考訳(メタデータ) (2021-05-06T11:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。