論文の概要: Underwater object detection in sonar imagery with detection transformer and Zero-shot neural architecture search
- arxiv url: http://arxiv.org/abs/2505.06694v1
- Date: Sat, 10 May 2025 16:41:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.994611
- Title: Underwater object detection in sonar imagery with detection transformer and Zero-shot neural architecture search
- Title(参考訳): 検出トランスとゼロショットニューラルアーキテクチャサーチを用いたソナー画像中の水中物体検出
- Authors: XiaoTong Gu, Shengyu Tang, Yiming Cao, Changdong Yu,
- Abstract要約: ソナー画像を用いた水中物体検出は海洋技術における重要かつ急速に発展する研究領域となっている。
本稿では,ニューラルアーキテクチャサーチ(NAS)アプローチに最適化された検出変換器(DETR)アーキテクチャを提案する。
このアーキテクチャは2つの代表データセット上で最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 0.8624680612413766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater object detection using sonar imagery has become a critical and rapidly evolving research domain within marine technology. However, sonar images are characterized by lower resolution and sparser features compared to optical images, which seriously degrades the performance of object detection.To address these challenges, we specifically propose a Detection Transformer (DETR) architecture optimized with a Neural Architecture Search (NAS) approach called NAS-DETR for object detection in sonar images. First, an improved Zero-shot Neural Architecture Search (NAS) method based on the maximum entropy principle is proposed to identify a real-time, high-representational-capacity CNN-Transformer backbone for sonar image detection. This method enables the efficient discovery of high-performance network architectures with low computational and time overhead. Subsequently, the backbone is combined with a Feature Pyramid Network (FPN) and a deformable attention-based Transformer decoder to construct a complete network architecture. This architecture integrates various advanced components and training schemes to enhance overall performance. Extensive experiments demonstrate that this architecture achieves state-of-the-art performance on two Representative datasets, while maintaining minimal overhead in real-time efficiency and computational complexity. Furthermore, correlation analysis between the key parameters and differential entropy-based fitness function is performed to enhance the interpretability of the proposed framework. To the best of our knowledge, this is the first work in the field of sonar object detection to integrate the DETR architecture with a NAS search mechanism.
- Abstract(参考訳): ソナー画像を用いた水中物体検出は海洋技術における重要かつ急速に発展する研究領域となっている。
しかし, ソナー画像は, 物体検出性能を著しく低下させる光学画像に比べて低分解能とスペーサー特性が特徴であり, これらの課題に対処するために, ソナー画像における物体検出のためのNAS-DETR(Neural Architecture Search)アプローチに最適化された検出変換器(DETR)アーキテクチャを提案する。
まず,最大エントロピー原理に基づくZero-shot Neural Architecture Search (NAS)法を提案する。
この手法により、計算時間と時間オーバーヘッドの少ない高性能ネットワークアーキテクチャの効率的な発見が可能となる。
その後、バックボーンにはFeature Pyramid Network (FPN)と変形可能なアテンションベースのTransformerデコーダが組み合わされ、完全なネットワークアーキテクチャが構築される。
このアーキテクチャは、様々な高度なコンポーネントとトレーニングスキームを統合し、全体的なパフォーマンスを向上させる。
大規模な実験は、このアーキテクチャがリアルタイム効率と計算複雑性の最小限のオーバーヘッドを維持しながら、2つの代表データセット上で最先端のパフォーマンスを達成することを示した。
さらに、鍵パラメータと微分エントロピーに基づく適合関数の相関解析を行い、提案フレームワークの解釈可能性を高める。
我々の知る限りでは、これは、DreTRアーキテクチャとNAS検索機構を統合するソナーオブジェクト検出の分野における最初の研究である。
関連論文リスト
- MI-DETR: An Object Detection Model with Multi-time Inquiries Mechanism [67.56918651825056]
並列マルチ時間問い合わせ(MI)機構を備えた新しいデコーダアーキテクチャを提案する。
我々のMIベースモデルであるMI-DETRはCOCOベンチマークで既存のDETRライクなモデルよりも優れています。
診断と可視化の一連の実験は、MIの有効性、合理性、解釈可能性を示している。
論文 参考訳(メタデータ) (2025-03-03T12:19:06Z) - EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [20.209756662832365]
微分可能なニューラルアーキテクチャサーチ(DARTS)は、高い探索効率でアーキテクチャ設計のマニュアルプロセスを自動化する。
眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
EM-DARTSは、最先端の認識性能につながる最適なアーキテクチャを実現できることを示す。
論文 参考訳(メタデータ) (2024-09-22T13:11:08Z) - Efficient and Accurate Hyperspectral Image Demosaicing with Neural Network Architectures [3.386560551295746]
本研究では,ハイパースペクトル画像復調におけるニューラルネットワークアーキテクチャの有効性について検討した。
様々なネットワークモデルと修正を導入し、それらを従来の手法や既存の参照ネットワークアプローチと比較する。
その結果、我々のネットワークは、例外的な性能を示す両方のデータセットにおいて、参照モデルよりも優れるか、一致していることがわかった。
論文 参考訳(メタデータ) (2023-12-21T08:02:49Z) - Multi-Objective Evolutionary for Object Detection Mobile Architectures
Search [21.14296703753317]
NASシナリオの非支配的ソートに基づく移動体検出バックボーンネットワークアーキテクチャ探索アルゴリズムを提案する。
提案手法は,重みマッピング手法を用いて,異なる深さ,幅,拡張サイズでバックボーンネットワークを探索することができる。
類似の計算複雑性の下では、検索したバックボーンネットワークアーキテクチャの精度は、MobileDetよりも2.0% mAP高い。
論文 参考訳(メタデータ) (2022-11-05T00:28:49Z) - Neural Architecture Adaptation for Object Detection by Searching Channel
Dimensions and Mapping Pre-trained Parameters [17.090405682103167]
ほとんどのオブジェクト検出フレームワークは、元来画像分類用に設計されたバックボーンアーキテクチャを使用する。
最近のニューラルアーキテクチャサーチ(NAS)研究は、オブジェクト検出に特化したバックボーンの自動設計が全体的な精度を向上させることを実証している。
本稿では,検出目的のために与えられたバックボーンを最適化するニューラルアーキテクチャ適応手法を提案する。
論文 参考訳(メタデータ) (2022-06-17T02:01:56Z) - Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。
VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。
これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文 参考訳(メタデータ) (2022-03-20T02:59:51Z) - NAS-FCOS: Efficient Search for Object Detection Architectures [113.47766862146389]
簡易なアンカーフリー物体検出器の特徴ピラミッドネットワーク (FPN) と予測ヘッドを探索し, より効率的な物体検出手法を提案する。
慎重に設計された検索空間、検索アルゴリズム、ネットワーク品質を評価するための戦略により、8つのV100 GPUを使用して、4日以内に最高のパフォーマンスの検知アーキテクチャを見つけることができる。
論文 参考訳(メタデータ) (2021-10-24T12:20:04Z) - Neural Architecture Optimization with Graph VAE [21.126140965779534]
連続空間におけるネットワークアーキテクチャを最適化するための効率的なNAS手法を提案する。
フレームワークは、エンコーダ、パフォーマンス予測器、複雑性予測器、デコーダの4つのコンポーネントを共同で学習する。
論文 参考訳(メタデータ) (2020-06-18T07:05:48Z) - Stage-Wise Neural Architecture Search [65.03109178056937]
ResNetやNASNetのような現代の畳み込みネットワークは、多くのコンピュータビジョンアプリケーションで最先端の結果を得た。
これらのネットワークは、同じ解像度で表現を操作するレイヤのセットであるステージで構成されている。
各ステージにおけるレイヤー数の増加はネットワークの予測能力を向上させることが示されている。
しかし、結果として得られるアーキテクチャは、浮動小数点演算、メモリ要求、推論時間の観点から計算的に高価になる。
論文 参考訳(メタデータ) (2020-04-23T14:16:39Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。