論文の概要: Object recognition in atmospheric turbulence scenes
- arxiv url: http://arxiv.org/abs/2210.14318v2
- Date: Mon, 29 May 2023 18:55:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 02:26:15.573470
- Title: Object recognition in atmospheric turbulence scenes
- Title(参考訳): 大気乱流シーンにおける物体認識
- Authors: Disen Hu and Nantheera Anantrasirichai
- Abstract要約: 乱流環境におけるオブジェクトの型を検知・分類するための歪み特徴を学習する新しいフレームワークを提案する。
具体的には、変形可能な畳み込みを利用して空間変位を処理する。
提案手法は平均精度(mAP)が30%を超えるベンチマークよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 2.657505380055164
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The influence of atmospheric turbulence on acquired surveillance imagery
poses significant challenges in image interpretation and scene analysis.
Conventional approaches for target classification and tracking are less
effective under such conditions. While deep-learning-based object detection
methods have shown great success in normal conditions, they cannot be directly
applied to atmospheric turbulence sequences. In this paper, we propose a novel
framework that learns distorted features to detect and classify object types in
turbulent environments. Specifically, we utilise deformable convolutions to
handle spatial turbulent displacement. Features are extracted using a feature
pyramid network, and Faster R-CNN is employed as the object detector.
Experimental results on a synthetic VOC dataset demonstrate that the proposed
framework outperforms the benchmark with a mean Average Precision (mAP) score
exceeding 30%. Additionally, subjective results on real data show significant
improvement in performance.
- Abstract(参考訳): 取得した監視画像に対する大気乱流の影響は、画像の解釈やシーン分析において大きな課題となっている。
このような状況下では、目標分類と追跡に対する従来のアプローチは効果が低い。
深層学習に基づく物体検出手法は, 正常条件下では大きな成功を収めているが, 大気乱流列に直接適用することはできない。
本稿では,乱流環境における物体のタイプを検出し,分類するための歪み特徴を学習する新しいフレームワークを提案する。
具体的には,変形可能な畳み込みを利用して空間乱流の変位を扱う。
特徴ピラミッドネットワークを用いて特徴を抽出し,オブジェクト検出器として高速R-CNNを用いる。
合成VOCデータセットによる実験結果から,提案手法は平均精度(mAP)スコアが30%を超えるベンチマークよりも優れていた。
さらに、実データに対する主観的結果では、性能が著しく向上している。
関連論文リスト
- SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients [0.8873228457453465]
空中画像における小さな物体検出は、コンピュータビジョンにおいて重要な課題である。
トランスフォーマーベースのモデルを用いた従来の手法は、特殊データベースの欠如に起因する制限に直面していることが多い。
本稿では,小型空中物体の検出とセグメンテーション機能を大幅に向上する2つの革新的なアプローチを紹介する。
論文 参考訳(メタデータ) (2024-05-02T19:47:08Z) - From Blurry to Brilliant Detection: YOLOv5-Based Aerial Object Detection
with Super Resolution [4.107182710549721]
超解像度と適応型軽量YOLOv5アーキテクチャを組み合わせた革新的なアプローチを提案する。
実験により,小型で密集した物体の検出において,モデルの性能が優れていることを示した。
論文 参考訳(メタデータ) (2024-01-26T05:50:58Z) - Enhancing Lidar-based Object Detection in Adverse Weather using Offset
Sequences in Time [1.1725016312484975]
ライダーによる物体検出は、雨や霧などの悪天候の影響を著しく受けている。
本研究は,ライダーによる物体検出の信頼性に対する悪天候の影響を緩和する有効な方法の総合的研究である。
論文 参考訳(メタデータ) (2024-01-17T08:31:58Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:01:01Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Benchmarking Unsupervised Object Representations for Video Sequences [111.81492107649889]
ViMON, OP3, TBA, SCALORの4つのオブジェクト中心アプローチの知覚能力を比較した。
この結果から,制約のない潜在表現を持つアーキテクチャは,オブジェクト検出やセグメンテーション,トラッキングといった観点から,より強力な表現を学習できる可能性が示唆された。
我々のベンチマークは、より堅牢なオブジェクト中心のビデオ表現を学習するための実りあるガイダンスを提供するかもしれない。
論文 参考訳(メタデータ) (2020-06-12T09:37:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。