論文の概要: Excavating RoI Attention for Underwater Object Detection
- arxiv url: http://arxiv.org/abs/2206.12128v1
- Date: Fri, 24 Jun 2022 07:45:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-27 13:59:24.060763
- Title: Excavating RoI Attention for Underwater Object Detection
- Title(参考訳): 水中物体検出のための掘削roi注意
- Authors: Xutao Liang, Pinhao Song
- Abstract要約: 自己注意はコンピュータビジョンで人気があり、ピクセルレベルの注意とパッチレベルの注意に分類される。
オブジェクト検出では、RoI機能は基本機能マップからのパッチとして見ることができる。
本稿では,RoI機能にアテンションモジュールを適用して性能を向上させることを目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-attention is one of the most successful designs in deep learning, which
calculates the similarity of different tokens and reconstructs the feature
based on the attention matrix. Originally designed for NLP, self-attention is
also popular in computer vision, and can be categorized into pixel-level
attention and patch-level attention. In object detection, RoI features can be
seen as patches from base feature maps. This paper aims to apply the attention
module to RoI features to improve performance. Instead of employing an original
self-attention module, we choose the external attention module, a modified
self-attention with reduced parameters. With the proposed double head structure
and the Positional Encoding module, our method can achieve promising
performance in object detection. The comprehensive experiments show that it
achieves promising performance, especially in the underwater object detection
dataset. The code will be avaiable in:
https://github.com/zsyasd/Excavating-RoI-Attention-for-Underwater-Object-Detection
- Abstract(参考訳): 自己注意はディープラーニングにおいて最も成功した設計の一つであり、異なるトークンの類似性を計算し、注意行列に基づいて特徴を再構築する。
NLP用に設計されたセルフアテンションはコンピュータビジョンでも人気があり、ピクセルレベルの注意とパッチレベルの注意に分類することができる。
オブジェクト検出では、RoI機能は基本機能マップからのパッチとして見ることができる。
本稿では,RoI機能にアテンションモジュールを適用して性能を向上させることを目的とする。
オリジナルの自己注意モジュールを使う代わりに、パラメータを減らした自己注意モジュール、外部注意モジュールを選択します。
提案するダブルヘッド構造と位置符号化モジュールにより,提案手法は物体検出において有望な性能を実現することができる。
総合的な実験により、特に水中物体検出データセットにおいて、有望な性能を達成することが示された。
https://github.com/zsyasd/Excavating-RoI-Attention-for-Underwater-Object-detection
関連論文リスト
- Object-centric Cross-modal Feature Distillation for Event-based Object
Detection [87.50272918262361]
RGB検出器は、イベントデータのばらつきと視覚的詳細の欠如により、イベントベースの検出器よりも優れている。
これら2つのモード間の性能ギャップを縮めるための新しい知識蒸留手法を開発した。
対象中心蒸留により,イベントベースの学生物体検出装置の性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-11-09T16:33:08Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - SparseBERT: Rethinking the Importance Analysis in Self-attention [107.68072039537311]
トランスフォーマーベースのモデルは、その強力な能力のために自然言語処理(NLP)タスクに人気がある。
事前学習モデルの注意マップの可視化は,自己着脱機構を理解するための直接的な方法の一つである。
本研究では,sparsebert設計の指導にも適用可能な微分可能アテンションマスク(dam)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-25T14:13:44Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Rotate to Attend: Convolutional Triplet Attention Module [21.228370317693244]
3分岐構造を用いた新しい注意重み計算法である三重項注意法を提案する。
本手法は単純かつ効率的であり,アドオンモジュールとして従来のバックボーンネットワークに簡単に接続できる。
ImageNet-1k上の画像分類や,MSCOCOおよびPASCAL VOCデータセット上でのオブジェクト検出など,様々な課題に対する本手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-10-06T21:31:00Z) - Attention-based Assisted Excitation for Salient Object Detection [3.238929552408813]
脳内の物体に基づく注意から着想を得たCNNの特徴地図におけるアクティベーションの修飾機構を導入する。
脳と同様、私たちはこのアイデアを使って、厳密な物体検出における2つの課題に対処する。
我々は、AlexNet、VGG、ResNetといったエンコーダ部分の異なるアーキテクチャを用いて、U-netモデルにおけるオブジェクトベースの注意を実装する。
論文 参考訳(メタデータ) (2020-03-31T13:33:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。