Fugu-MT 論文翻訳(概要): Stable Diffusion For Aerial Object Detection

論文の概要: Stable Diffusion For Aerial Object Detection

arxiv url: http://arxiv.org/abs/2311.12345v1
Date: Tue, 21 Nov 2023 04:38:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 02:09:49.759179
Title: Stable Diffusion For Aerial Object Detection
Title（参考訳）: 空中物体検出のための安定拡散
Authors: Yanan Jian, Fuxun Yu, Simranjit Singh, Dimitrios Stamoulis
Abstract要約: 本研究では,空中画像に適した合成データ拡張フレームワークを提案する。セマンティックギャップを橋渡し、低ランク適応(LORA)で拡散モデルを微調整し、徹底的な再トレーニングを回避し、最後に、背景を持つ合成オブジェクトを構成する Copy-Paste 法を含む。
参考スコア（独自算出の注目度）: 4.014524824655107
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Aerial object detection is a challenging task, in which one major obstacle lies in the limitations of large-scale data collection and the long-tail distribution of certain classes. Synthetic data offers a promising solution, especially with recent advances in diffusion-based methods like stable diffusion (SD). However, the direct application of diffusion methods to aerial domains poses unique challenges: stable diffusion's optimization for rich ground-level semantics doesn't align with the sparse nature of aerial objects, and the extraction of post-synthesis object coordinates remains problematic. To address these challenges, we introduce a synthetic data augmentation framework tailored for aerial images. It encompasses sparse-to-dense region of interest (ROI) extraction to bridge the semantic gap, fine-tuning the diffusion model with low-rank adaptation (LORA) to circumvent exhaustive retraining, and finally, a Copy-Paste method to compose synthesized objects with backgrounds, providing a nuanced approach to aerial object detection through synthetic data.
Abstract（参考訳）: 空中物体検出は、大規模なデータ収集の限界と特定のクラスの長い尾の分布に1つの大きな障害がある、難しい課題である。合成データは、特に安定拡散(SD)のような拡散に基づく手法の最近の進歩において、有望な解を提供する。しかし、拡散法の航空領域への直接適用は、安定拡散のリッチな地上レベルのセマンティクスに対する最適化は、空中物体のスパースな性質と一致せず、合成後の物体座標の抽出には問題が残る。これらの課題に対処するために,空中画像に適した合成データ拡張フレームワークを提案する。セマンティックギャップを橋渡しし、低ランク適応(LORA)で拡散モデルを微調整し、徹底的な再トレーニングを回避し、最後に、背景を持つ合成オブジェクトを構成する Copy-Paste 法を適用し、合成データによる空中物体検出へのニュアンスなアプローチを提供する。

関連論文リスト

Erase Diffusion: Empowering Object Removal Through Calibrating Diffusion Pathways [13.08168394252538]
Erase inpaintingは、周囲のコンテンツの全体的な一貫性を維持しながら、マスクされた領域内でターゲットオブジェクトを正確に除去することを目的としている。オブジェクト除去の文脈において,標準拡散の潜在的なパワーを解放することを目的として,Eraase Diffusionと呼ばれる新しいEraase Diffusionを提案する。提案したEraDiffは,OpenImages V5データセットの最先端性能を実現し,実世界のシナリオにおいて大きな優位性を示す。
論文参考訳（メタデータ） (2025-03-10T08:06:51Z)
Diffusion Suction Grasping with Large-Scale Parcel Dataset [6.112197264635304]
提案するParcel-Suction-Datasetは,4億1000万の高精度な吸引把握ポーズを備えた,25万の散布シーンを含む大規模合成データセットである。このデータセットは、最適吸引グリップの効率的な生成を可能にする新しい幾何サンプリングアルゴリズムによって生成される。また、条件生成タスクとして、吸引把握予測を再構成する革新的なフレームワークであるDiffusion-Suctionを提案する。
論文参考訳（メタデータ） (2025-02-11T04:09:11Z)
Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.45019514036948]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文参考訳（メタデータ） (2024-12-23T21:27:19Z)
Anomaly detection using Diffusion-based methods [15.049468347670421]
本稿では,拡散モデルによる異常検出の有用性について検討する。コンパクトデータセットと高解像度データセットの両方における偏差を識別する効果に重点を置いている。
論文参考訳（メタデータ） (2024-12-10T14:17:23Z)
Sub-DM:Subspace Diffusion Model with Orthogonal Decomposition for MRI Reconstruction [13.418240070456987]
サブスペース拡散モデル (Sub-DM) は、k空間のデータ分布がノイズに向かって進化するにつれて、サブスペースへの射影による拡散過程を制限するサブスペース拡散モデルである。 k空間データのコンプレックスと高次元特性によって引き起こされる推論問題を回避する。これにより、異なる空間における拡散過程が相互フィードバック機構を通じてモデルを洗練することができ、複雑なk空間データを扱う場合でも、アクカレートの事前学習が可能になる。
論文参考訳（メタデータ） (2024-11-06T08:33:07Z)
Stochastic Reconstruction of Gappy Lagrangian Turbulent Signals by Conditional Diffusion Models [1.7810134788247751]
本研究では, 乱流によって受動的に対流する小物体の軌道に沿って, 空間・速度の欠落を再現する手法を提案する。近年提案されているデータ駆動機械学習技術である条件付き生成拡散モデルを利用する。
論文参考訳（メタデータ） (2024-10-31T14:26:10Z)
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
拡散モデルは、例外的な品質、詳細な解像度、強い文脈認識を提供することによって、テキストと画像の合成に革命をもたらした。本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。 DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文参考訳（メタデータ） (2024-10-14T02:49:23Z)
Diffusion State-Guided Projected Gradient for Inverse Problems [82.24625224110099]
逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。 DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。 DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文参考訳（メタデータ） (2024-10-04T14:26:54Z)
Spatially-Aware Diffusion Models with Cross-Attention for Global Field Reconstruction with Sparse Observations [1.371691382573869]
フィールド再構成タスクにおけるスコアベース拡散モデルの開発と拡張を行う。本研究では,観測領域と観測領域の間のトラクタブルマッピングを構築するための条件符号化手法を提案する。本研究では, モデルが再現可能かどうかを把握し, 融合結果の精度を向上する能力を示す。
論文参考訳（メタデータ） (2024-08-30T19:46:23Z)
Hierarchical Features Matter: A Deep Exploration of GAN Priors for Improved Dataset Distillation [51.44054828384487]
階層的生成潜在蒸留(H-GLaD)と呼ばれる新しいパラメータ化法を提案する。本手法はGAN内の階層層を系統的に探索する。さらに,合成データセット評価に伴う計算負担を軽減するために,新しいクラス関連特徴距離尺度を導入する。
論文参考訳（メタデータ） (2024-06-09T09:15:54Z)
Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文参考訳（メタデータ） (2023-12-18T09:52:14Z)
DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。 MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-12-11T18:38:28Z)
SatDM: Synthesizing Realistic Satellite Image with Semantic Layout Conditioning using Diffusion Models [0.0]
Denoising Diffusion Probabilistic Models (DDPM) は意味的レイアウトから現実的なイメージを合成する上で大きな可能性を証明している。本稿では,セマンティックマップを用いて高品質で多様な衛星画像を生成する条件付きDDPMモデルを提案する。提案モデルの有効性は,本研究の文脈内で導入した詳細なラベル付きデータセットを用いて検証する。
論文参考訳（メタデータ） (2023-09-28T19:39:13Z)
SF-FSDA: Source-Free Few-Shot Domain Adaptive Object Detection with Efficient Labeled Data Factory [94.11898696478683]
ドメイン適応オブジェクト検出は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしのターゲットドメインのパフォーマンスを改善することを目的としています。本研究では,SF-FSDA という名称のソースフリーおよび少数ショット条件下で,より実用的で困難な領域適応型オブジェクト検出問題を提案し,検討する。
論文参考訳（メタデータ） (2023-06-07T12:34:55Z)
Few Shot Generative Model Adaption via Relaxed Spatial Structural Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文参考訳（メタデータ） (2022-03-06T14:26:25Z)
Extreme Learning Machine for the Characterization of Anomalous Diffusion from Single Trajectories [0.0]
エクストリームラーニングマシンとフィーチャーエンジニアリング(AnDi-ELM)を組み合わせることで、AnDiチャレンジのタスクに取り組むためのシンプルなアプローチを説明します。この手法は,計算資源に制限のある簡単な実装と高速な訓練時間を提供しながら,良好な性能を達成する。
論文参考訳（メタデータ） (2021-05-06T11:56:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。