論文の概要: Object recognition in atmospheric turbulence scenes
- arxiv url: http://arxiv.org/abs/2210.14318v1
- Date: Tue, 25 Oct 2022 20:21:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 14:50:48.300303
- Title: Object recognition in atmospheric turbulence scenes
- Title(参考訳): 大気乱流シーンにおける物体認識
- Authors: Disen Hu and Nantheera Anantrasirichai
- Abstract要約: 本稿では,オブジェクトの型を検出し,分類するための歪んだ特徴を学習する新しいフレームワークを提案する。
具体的には、変形可能な畳み込みを利用して空間乱流の変位に対処する。
その結果,提案フレームワークは平均精度(mAP)スコアが30%以上でベンチマークを上回った。
- 参考スコア(独自算出の注目度): 2.657505380055164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The influence of atmospheric turbulence on acquired surveillance imagery
makes image interpretation and scene analysis extremely difficult. It also
reduces the effectiveness of conventional approaches for classifying, and
tracking targets in the scene. Whilst deep-learning based object detection is
highly successful in normal conditions, these methods cannot directly be
applied to the atmospheric turbulence sequences. This paper hence proposes a
novel framework learning the distorted features to detect and classify object
types. Specifically, deformable convolutions are exploited to deal with spatial
turbulent displacement. The features are extracted via a feature pyramid
network and Faster R-CNN is employed as a detector. Testing with synthetic VOC
dataset, the results show that the proposed framework outperforms the benchmark
with mean Average Precision (mAP) score of >30%. Subjective results on the real
data are also significantly improved.
- Abstract(参考訳): 大気乱流が取得した監視画像に与える影響は、画像解釈とシーン分析を極めて困難にしている。
また、シーン内のターゲットを分類、追跡するための従来の手法の有効性を低減する。
深層学習に基づく物体検出は正常な条件下では極めて成功したが、これらの手法は大気乱流列に直接適用することはできない。
そこで本稿では,変形した特徴を学習し,オブジェクトタイプの検出と分類を行う新しいフレームワークを提案する。
具体的には、変形可能な畳み込みを利用して空間乱流の変位を扱う。
これらの特徴は特徴ピラミッドネットワークを介して抽出され、より高速なR-CNNが検出器として使用される。
合成vocデータセットを用いてテストした結果,提案フレームワークは平均精度 (map) スコアが30%以上でベンチマークを上回った。
実データに対する主観的な結果も大幅に改善される。
関連論文リスト
- SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients [0.8873228457453465]
空中画像における小さな物体検出は、コンピュータビジョンにおいて重要な課題である。
トランスフォーマーベースのモデルを用いた従来の手法は、特殊データベースの欠如に起因する制限に直面していることが多い。
本稿では,小型空中物体の検出とセグメンテーション機能を大幅に向上する2つの革新的なアプローチを紹介する。
論文 参考訳(メタデータ) (2024-05-02T19:47:08Z) - From Blurry to Brilliant Detection: YOLOv5-Based Aerial Object Detection
with Super Resolution [4.107182710549721]
超解像度と適応型軽量YOLOv5アーキテクチャを組み合わせた革新的なアプローチを提案する。
実験により,小型で密集した物体の検出において,モデルの性能が優れていることを示した。
論文 参考訳(メタデータ) (2024-01-26T05:50:58Z) - Enhancing Lidar-based Object Detection in Adverse Weather using Offset
Sequences in Time [1.1725016312484975]
ライダーによる物体検出は、雨や霧などの悪天候の影響を著しく受けている。
本研究は,ライダーによる物体検出の信頼性に対する悪天候の影響を緩和する有効な方法の総合的研究である。
論文 参考訳(メタデータ) (2024-01-17T08:31:58Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:01:01Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Benchmarking Unsupervised Object Representations for Video Sequences [111.81492107649889]
ViMON, OP3, TBA, SCALORの4つのオブジェクト中心アプローチの知覚能力を比較した。
この結果から,制約のない潜在表現を持つアーキテクチャは,オブジェクト検出やセグメンテーション,トラッキングといった観点から,より強力な表現を学習できる可能性が示唆された。
我々のベンチマークは、より堅牢なオブジェクト中心のビデオ表現を学習するための実りあるガイダンスを提供するかもしれない。
論文 参考訳(メタデータ) (2020-06-12T09:37:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。