Fugu-MT 論文翻訳(概要): Object recognition in atmospheric turbulence scenes

論文の概要: Object recognition in atmospheric turbulence scenes

arxiv url: http://arxiv.org/abs/2210.14318v2
Date: Mon, 29 May 2023 18:55:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-01 02:26:15.573470
Title: Object recognition in atmospheric turbulence scenes
Title（参考訳）: 大気乱流シーンにおける物体認識
Authors: Disen Hu and Nantheera Anantrasirichai
Abstract要約: 乱流環境におけるオブジェクトの型を検知・分類するための歪み特徴を学習する新しいフレームワークを提案する。具体的には、変形可能な畳み込みを利用して空間変位を処理する。提案手法は平均精度(mAP)が30%を超えるベンチマークよりも優れていることを示す。
参考スコア（独自算出の注目度）: 2.657505380055164
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The influence of atmospheric turbulence on acquired surveillance imagery poses significant challenges in image interpretation and scene analysis. Conventional approaches for target classification and tracking are less effective under such conditions. While deep-learning-based object detection methods have shown great success in normal conditions, they cannot be directly applied to atmospheric turbulence sequences. In this paper, we propose a novel framework that learns distorted features to detect and classify object types in turbulent environments. Specifically, we utilise deformable convolutions to handle spatial turbulent displacement. Features are extracted using a feature pyramid network, and Faster R-CNN is employed as the object detector. Experimental results on a synthetic VOC dataset demonstrate that the proposed framework outperforms the benchmark with a mean Average Precision (mAP) score exceeding 30%. Additionally, subjective results on real data show significant improvement in performance.
Abstract（参考訳）: 取得した監視画像に対する大気乱流の影響は、画像の解釈やシーン分析において大きな課題となっている。このような状況下では、目標分類と追跡に対する従来のアプローチは効果が低い。深層学習に基づく物体検出手法は, 正常条件下では大きな成功を収めているが, 大気乱流列に直接適用することはできない。本稿では,乱流環境における物体のタイプを検出し,分類するための歪み特徴を学習する新しいフレームワークを提案する。具体的には,変形可能な畳み込みを利用して空間乱流の変位を扱う。特徴ピラミッドネットワークを用いて特徴を抽出し,オブジェクト検出器として高速R-CNNを用いる。合成VOCデータセットによる実験結果から,提案手法は平均精度(mAP)スコアが30%を超えるベンチマークよりも優れていた。さらに、実データに対する主観的結果では、性能が著しく向上している。

関連論文リスト

Enhancing Egocentric Object Detection in Static Environments using Graph-based Spatial Anomaly Detection and Correction [0.0]
本稿では,物体間の空間的関係を明示的にモデル化し,自己中心型フレームにおける異常検出を補正するグラフベースの後処理パイプラインを提案する。手動でアノテートされたデータに基づいてトレーニングされたグラフニューラルネットワーク(GNN)を用いて、無効なオブジェクトクラスラベルを特定し、近隣のコンテキストに基づいて修正されたクラスラベルを予測する。実験では、この空間推論を組み込むことで検出性能が大幅に向上し、mAP@50は最大4%向上した。
論文参考訳（メタデータ） (2025-08-11T05:08:02Z)
DMAT: An End-to-End Framework for Joint Atmospheric Turbulence Mitigation and Object Detection [7.0622384724837355]
大気乱流(AT)は、監視画像の明瞭さと精度を低下させる。視覚的品質を改善するために深層学習に基づく手法が提案されているが、新しい歪みは依然として大きな問題である。本稿では,変形した特徴を補償し,可視化とオブジェクト検出を同時に改善するフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-06T10:12:02Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
TopoFR: A Closer Look at Topology Alignment on Face Recognition [58.45515807380505]
PTSAと呼ばれるトポロジカル構造アライメント戦略とSDEという硬質試料マイニング戦略を利用する新しいFRモデルであるTopoFRを提案する。 PTSAは永続ホモロジーを用いて入力空間と潜在空間の位相構造を整列し、構造情報を効果的に保存し、FRモデルの一般化性能を向上させる。一般的な顔のベンチマーク実験の結果は、最先端の手法よりもTopoFRの方が優れていることを示している。
論文参考訳（メタデータ） (2024-10-14T14:58:30Z)
SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients [0.8873228457453465]
空中画像における小さな物体検出は、コンピュータビジョンにおいて重要な課題である。トランスフォーマーベースのモデルを用いた従来の手法は、特殊データベースの欠如に起因する制限に直面していることが多い。本稿では,小型空中物体の検出とセグメンテーション機能を大幅に向上する2つの革新的なアプローチを紹介する。
論文参考訳（メタデータ） (2024-05-02T19:47:08Z)
From Blurry to Brilliant Detection: YOLOv5-Based Aerial Object Detection with Super Resolution [4.107182710549721]
超解像度と適応型軽量YOLOv5アーキテクチャを組み合わせた革新的なアプローチを提案する。実験により,小型で密集した物体の検出において,モデルの性能が優れていることを示した。
論文参考訳（メタデータ） (2024-01-26T05:50:58Z)
Enhancing Lidar-based Object Detection in Adverse Weather using Offset Sequences in Time [1.1725016312484975]
ライダーによる物体検出は、雨や霧などの悪天候の影響を著しく受けている。本研究は,ライダーによる物体検出の信頼性に対する悪天候の影響を緩和する有効な方法の総合的研究である。
論文参考訳（メタデータ） (2024-01-17T08:31:58Z)
Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文参考訳（メタデータ） (2023-12-18T09:52:14Z)
Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。提案手法は平均精度(MAP)を約45.7%向上させる。この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文参考訳（メタデータ） (2023-11-21T19:49:13Z)
Context-Preserving Instance-Level Augmentation and Deformable Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文参考訳（メタデータ） (2022-02-14T07:01:01Z)
Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文参考訳（メタデータ） (2021-07-14T21:10:47Z)
Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文参考訳（メタデータ） (2021-04-22T12:47:37Z)
Benchmarking Unsupervised Object Representations for Video Sequences [111.81492107649889]
ViMON, OP3, TBA, SCALORの4つのオブジェクト中心アプローチの知覚能力を比較した。この結果から,制約のない潜在表現を持つアーキテクチャは,オブジェクト検出やセグメンテーション,トラッキングといった観点から,より強力な表現を学習できる可能性が示唆された。我々のベンチマークは、より堅牢なオブジェクト中心のビデオ表現を学習するための実りあるガイダンスを提供するかもしれない。
論文参考訳（メタデータ） (2020-06-12T09:37:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。