論文の概要: DiffMOD: Progressive Diffusion Point Denoising for Moving Object Detection in Remote Sensing
- arxiv url: http://arxiv.org/abs/2504.10278v1
- Date: Mon, 14 Apr 2025 14:44:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:51:25.511546
- Title: DiffMOD: Progressive Diffusion Point Denoising for Moving Object Detection in Remote Sensing
- Title(参考訳): DiffMOD:遠隔センシングにおける移動物体検出のためのプログレッシブ拡散点Denoising
- Authors: Jinyue Zhang, Xiangrong Zhang, Zhongjian Huang, Tianyang Zhang, Yifei Jiang, Licheng Jiao,
- Abstract要約: リモートセンシングにおける移動物体検出(MOD)は、低解像度、極めて小さなオブジェクトサイズ、複雑なノイズ干渉によって著しく困難である。
現在のディープラーニングに基づくMOD法は、オブジェクト間の柔軟な情報相互作用を制限する確率密度推定に依存している。
本稿では,移動物体中心をスパースノイズ点から反復的に回収する遠隔センシングのためのポイントベースMODを提案する。
- 参考スコア(独自算出の注目度): 40.607660968380394
- License:
- Abstract: Moving object detection (MOD) in remote sensing is significantly challenged by low resolution, extremely small object sizes, and complex noise interference. Current deep learning-based MOD methods rely on probability density estimation, which restricts flexible information interaction between objects and across temporal frames. To flexibly capture high-order inter-object and temporal relationships, we propose a point-based MOD in remote sensing. Inspired by diffusion models, the network optimization is formulated as a progressive denoising process that iteratively recovers moving object centers from sparse noisy points. Specifically, we sample scattered features from the backbone outputs as atomic units for subsequent processing, while global feature embeddings are aggregated to compensate for the limited coverage of sparse point features. By modeling spatial relative positions and semantic affinities, Spatial Relation Aggregation Attention is designed to enable high-order interactions among point-level features for enhanced object representation. To enhance temporal consistency, the Temporal Propagation and Global Fusion module is designed, which leverages an implicit memory reasoning mechanism for robust cross-frame feature integration. To align with the progressive denoising process, we propose a progressive MinK optimal transport assignment strategy that establishes specialized learning objectives at each denoising level. Additionally, we introduce a missing loss function to counteract the clustering tendency of denoised points around salient objects. Experiments on the RsData remote sensing MOD dataset show that our MOD method based on scattered point denoising can more effectively explore potential relationships between sparse moving objects and improve the detection capability and temporal consistency.
- Abstract(参考訳): リモートセンシングにおける移動物体検出(MOD)は、低解像度、極めて小さなオブジェクトサイズ、複雑なノイズ干渉によって著しく困難である。
現在のディープラーニングに基づくMOD法は、オブジェクト間の柔軟な情報相互作用と時間的フレーム間の相互作用を制限する確率密度推定に依存している。
本研究では,高次物体間および時間的関係を柔軟に捉えるために,リモートセンシングにおけるポイントベースMODを提案する。
拡散モデルにインスパイアされたネットワーク最適化は、運動する物体中心をスパースノイズ点から反復的に回復するプログレッシブ・デノナイジング・プロセスとして定式化される。
具体的には、後続処理の原子単位としてバックボーン出力から散乱した特徴をサンプリングし、大域的特徴埋め込みはスパースポイント特徴の限られた範囲を補うために集約する。
空間的相対的位置と意味的親和性をモデル化することにより、空間的関係集約注意は、拡張対象表現のための点レベルの特徴間の高次相互作用を可能にするように設計されている。
時間的一貫性を高めるため、Temporal Propagation and Global Fusionモジュールが設計されており、暗黙のメモリ推論機構を活用して、堅牢なクロスフレーム機能統合を実現している。
そこで本研究では,各段階の学習目標を個別に設定する,プログレッシブMinK最適輸送割当戦略を提案する。
さらに,有意な物体の周囲の分解点のクラスタリング傾向に対処するために,損失関数の欠如を導入する。
RsDataリモートセンシングMODデータセットを用いた実験により,散乱点の分解に基づくMOD法により,スパース移動物体間の潜在的な関係をより効果的に探索し,検出能力と時間的整合性を向上させることができることがわかった。
関連論文リスト
- Future Does Matter: Boosting 3D Object Detection with Temporal Motion Estimation in Point Cloud Sequences [25.74000325019015]
クロスフレーム動作予測情報を用いた時空間特徴学習を容易にするために,新しいLiDAR 3Dオブジェクト検出フレームワークLiSTMを導入する。
我々は,本フレームワークが優れた3次元検出性能を実現することを示すため,アグリゲーションとnuScenesデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-09-06T16:29:04Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Spatio-Temporal Point Process for Multiple Object Tracking [30.041104276095624]
多重オブジェクト追跡(MOT)は、連続するフレーム間の検出対象の関係をモデル化し、それらを異なる軌道にマージすることに焦点を当てている。
本稿では,物体を軌道に関連付ける前に,ノイズを効果的に予測し,マスクアウトし,検出結果を混乱させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-05T18:14:08Z) - Motion-aware Memory Network for Fast Video Salient Object Detection [15.967509480432266]
我々は、隣接するフレームから現在のフレームの有用な時間情報をVSODの時間枝として抽出する時空間メモリ(STM)ベースのネットワークを設計する。
符号化段階では、電流とその隣接するフレームから高次特徴を用いて高次時間特徴を生成する。
復号化段階では,空間的および時間的分岐に対する効果的な融合戦略を提案する。
提案モデルでは,光学フローなどの前処理を必要とせず,推定時に100FPS近い速度に達することができる。
論文 参考訳(メタデータ) (2022-08-01T15:56:19Z) - ProgressiveMotionSeg: Mutually Reinforced Framework for Event-Based
Motion Segmentation [101.19290845597918]
本稿では,動作推定 (ME) モジュールとイベントデノイング (ED) モジュールを相互に強化された方法で共同最適化する。
時間的相関をガイダンスとして、EDモジュールは各イベントが実活動イベントに属するという信頼度を算出し、MEモジュールに送信し、ノイズ抑制のための運動セグメンテーションのエネルギー関数を更新する。
論文 参考訳(メタデータ) (2022-03-22T13:40:26Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。