論文の概要: UniDet-D: A Unified Dynamic Spectral Attention Model for Object Detection under Adverse Weathers
- arxiv url: http://arxiv.org/abs/2506.12324v1
- Date: Sat, 14 Jun 2025 03:23:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:45.801233
- Title: UniDet-D: A Unified Dynamic Spectral Attention Model for Object Detection under Adverse Weathers
- Title(参考訳): UniDet-D: 逆気象下における物体検出のための統一された動的スペクトルアテンションモデル
- Authors: Yuantao Wang, Haowei Yang, Wei Zhang, Shijian Lu,
- Abstract要約: 各種気象条件下での物体検出に挑戦する統合フレームワークUniDet-Dを提案する。
具体的には、UniDet-Dは、非関連成分を抑えつつ、情報的スペクトル成分を適応的に強調するダイナミックスペクトルアテンション機構を組み込んでいる。
広汎な実験により、UniDet-Dは各種の悪天候劣化に対して優れた検出精度が得られることが示された。
- 参考スコア(独自算出の注目度): 48.39900749662755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world object detection is a challenging task where the captured images/videos often suffer from complex degradations due to various adverse weather conditions such as rain, fog, snow, low-light, etc. Despite extensive prior efforts, most existing methods are designed for one specific type of adverse weather with constraints of poor generalization, under-utilization of visual features while handling various image degradations. Leveraging a theoretical analysis on how critical visual details are lost in adverse-weather images, we design UniDet-D, a unified framework that tackles the challenge of object detection under various adverse weather conditions, and achieves object detection and image restoration within a single network. Specifically, the proposed UniDet-D incorporates a dynamic spectral attention mechanism that adaptively emphasizes informative spectral components while suppressing irrelevant ones, enabling more robust and discriminative feature representation across various degradation types. Extensive experiments show that UniDet-D achieves superior detection accuracy across different types of adverse-weather degradation. Furthermore, UniDet-D demonstrates superior generalization towards unseen adverse weather conditions such as sandstorms and rain-fog mixtures, highlighting its great potential for real-world deployment.
- Abstract(参考訳): 実世界の物体検出は、雨、霧、雪、低照度など様々な悪天候のために、キャプチャされた画像やビデオが複雑な劣化に苦しむ、困難な作業である。
事前の努力にもかかわらず、既存のほとんどの手法は、様々な画像劣化を処理しながら、視覚的特徴の過小評価、一般化の制約のある特定の種類の悪天候のために設計されている。
悪天候条件下での物体検出の課題に対処する統合フレームワークUniDet-Dを設計し,単一のネットワーク内で物体検出と画像復元を実現する。
具体的には、UniDet-Dは、非関係な成分を抑えつつ、情報的スペクトル成分を適応的に強調するダイナミックスペクトルアテンション機構を導入し、様々な劣化型に対してより堅牢で識別的な特徴表現を可能にする。
広汎な実験により、UniDet-Dは各種の悪天候劣化に対して優れた検出精度が得られることが示された。
さらに、UniDet-Dは砂嵐や雨と霧の混ざり合いのような目に見えない悪天候に対する優れた一般化を示し、現実世界の展開の可能性を強調している。
関連論文リスト
- From Fog to Failure: The Unintended Consequences of Dehazing on Object Detection in Clear Images [2.76348549160803]
本研究は,人間の視覚的手がかりに基づく脱ハジングを物体検出に組み込むことの課題について考察する。
本稿では,光検出装置が関心領域を検知し,空間的注意に基づくデハージングによって改善する多段階フレームワークを提案する。
霧の環境では有効であるが、この手法は鮮明な画像の性能を予期せず劣化させる。
論文 参考訳(メタデータ) (2025-02-04T05:24:44Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Real-Time Multi-Scene Visibility Enhancement for Promoting Navigational Safety of Vessels Under Complex Weather Conditions [48.529493393948435]
この可視光カメラは、インテリジェントな水上輸送システムにおいて、海洋表面の容器に不可欠なイメージングセンサーとして登場した。
視覚画像の画質は、複雑な気象条件下での様々な劣化に必然的に悩まされる。
本研究では,異なる気象条件下で撮影された劣化画像を復元する汎用多場面可視性向上手法を開発した。
論文 参考訳(メタデータ) (2024-09-02T23:46:27Z) - D-YOLO a robust framework for object detection in adverse weather conditions [0.0]
ヘイズ、雪、雨などの逆の気象条件は、画像品質の低下を招き、深層学習に基づく検知ネットワークの性能低下を招きかねない。
画像復元とオブジェクト検出のタスクをよりうまく統合するために,注目機能融合モジュールを備えた二重経路ネットワークを設計した。
我々はまた,検出ネットワークにヘイズフリーな機能を提供するサブネットワークを提案し,特に,明瞭な特徴抽出サブネットワークと検出ネットワーク間の距離を最小化することにより,検出ネットワークの性能を向上させる。
論文 参考訳(メタデータ) (2024-03-14T09:57:15Z) - MonoTDP: Twin Depth Perception for Monocular 3D Object Detection in
Adverse Scenes [49.21187418886508]
本論文は,モノTDP(MonoTDP)と呼ばれる悪シーンにおける2つの深度を知覚するモノクル3次元検出モデルを提案する。
まず、制御不能な気象条件を扱うモデルを支援するための適応学習戦略を導入し、様々な劣化要因による劣化を著しく抑制する。
そこで本研究では, シーン深度と物体深度を同時に推定する新たな2つの深度認識モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-18T13:42:02Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。