論文の概要: OrientedFormer: An End-to-End Transformer-Based Oriented Object Detector in Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2409.19648v1
- Date: Sun, 29 Sep 2024 10:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 22:04:15.440285
- Title: OrientedFormer: An End-to-End Transformer-Based Oriented Object Detector in Remote Sensing Images
- Title(参考訳): OrientedFormer: リモートセンシング画像におけるEnd-to-End変換器に基づくオブジェクト指向物体検出器
- Authors: Jiaqi Zhao, Zeyu Ding, Yong Zhou, Hancheng Zhu, Wen-Liang Du, Rui Yao, Abdulmotaleb El Saddik,
- Abstract要約: リモートセンシング画像におけるオブジェクト指向物体検出は、複数方向のオブジェクトが分散しているため、難しい課題である。
これらの問題に対処する3つの専用モジュールからなるエンドツーエンドのトランスフォーマベース指向オブジェクト検出器を提案する。
従来のエンドツーエンド検出器と比較して、OrientedFormerはDIOR-RとDOTA-v1.0でそれぞれ1.16および1.21 AP$_50$を獲得し、トレーニングエポックを3$times$から1$times$に下げる。
- 参考スコア(独自算出の注目度): 26.37802649901314
- License:
- Abstract: Oriented object detection in remote sensing images is a challenging task due to objects being distributed in multi-orientation. Recently, end-to-end transformer-based methods have achieved success by eliminating the need for post-processing operators compared to traditional CNN-based methods. However, directly extending transformers to oriented object detection presents three main issues: 1) objects rotate arbitrarily, necessitating the encoding of angles along with position and size; 2) the geometric relations of oriented objects are lacking in self-attention, due to the absence of interaction between content and positional queries; and 3) oriented objects cause misalignment, mainly between values and positional queries in cross-attention, making accurate classification and localization difficult. In this paper, we propose an end-to-end transformer-based oriented object detector, consisting of three dedicated modules to address these issues. First, Gaussian positional encoding is proposed to encode the angle, position, and size of oriented boxes using Gaussian distributions. Second, Wasserstein self-attention is proposed to introduce geometric relations and facilitate interaction between content and positional queries by utilizing Gaussian Wasserstein distance scores. Third, oriented cross-attention is proposed to align values and positional queries by rotating sampling points around the positional query according to their angles. Experiments on six datasets DIOR-R, a series of DOTA, HRSC2016 and ICDAR2015 show the effectiveness of our approach. Compared with previous end-to-end detectors, the OrientedFormer gains 1.16 and 1.21 AP$_{50}$ on DIOR-R and DOTA-v1.0 respectively, while reducing training epochs from 3$\times$ to 1$\times$. The codes are available at https://github.com/wokaikaixinxin/OrientedFormer.
- Abstract(参考訳): リモートセンシング画像におけるオブジェクト指向物体検出は、複数方向のオブジェクトが分散しているため、難しい課題である。
近年,従来のCNN方式と比較して,後処理演算子の必要性を排除して,エンドツーエンドトランスフォーマーベースの手法が成功を収めている。
しかし、変換器を直接オブジェクト指向オブジェクト検出に拡張することは、次の3つの主要な問題をもたらす。
1) 物体は任意に回転し,位置及び大きさとともに角度の符号化を必要とする。
2 配向対象物の幾何学的関係は、内容と位置関係の相互作用が欠如しているため、自己注意が欠如している。
3) 対象物は, 主に位置関係における値と位置関係の相違を生じ, 正確な分類と局所化を困難にしている。
本稿では,これらの問題に対処する3つの専用モジュールからなる,エンドツーエンドのトランスフォーマーに基づくオブジェクト指向検出器を提案する。
まず、ガウス分布を用いた配向箱の角度、位置、大きさを符号化するガウス位置符号化を提案する。
第二に、ワッサーシュタインの自己注意は幾何学的関係を導入し、ガウス的ワッサーシュタイン距離スコアを利用して、内容と位置的クエリ間の相互作用を促進する。
第3に、位置問合せの周囲のサンプリング点を角度に応じて回転させることにより、値と位置問合せを整列させる指向的相互注意を提案する。
DOTA,HRSC2016, ICDAR2015のシリーズであるDIOR-Rによる6つのデータセットの実験は、我々のアプローチの有効性を示している。
従来のエンドツーエンド検出器と比較して、OrientedFormerはDIOR-RとDOTA-v1.0でそれぞれ1.16および1.21 AP$_{50}$を獲得し、トレーニングエポックを3$\times$から1$\times$に下げる。
コードはhttps://github.com/wokaikaixinxin/OrientedFormerで入手できる。
関連論文リスト
- V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Phase-Shifting Coder: Predicting Accurate Orientation in Oriented Object
Detection [10.99534239215483]
物体の向きを正確に予測するために、位相シフトコーダ(PSC)と呼ばれる新しい微分可能な角度コーダを提案する。
オブジェクト指向物体検出における様々な周期的ファジィ問題に対する統一的なフレームワークを提供する。
3つのデータセットの視覚的分析と実験は、我々のアプローチの有効性と可能性を証明する。
論文 参考訳(メタデータ) (2022-11-11T17:31:25Z) - Single-stage Rotate Object Detector via Two Points with Solar Corona
Heatmap [16.85421977235311]
太陽コロナ熱マップを用いた単段回転物体検出器を開発し,指向性物体を検出する。
ROTPはオブジェクトの一部を予測し、それらを集約して全体像を形成する。
論文 参考訳(メタデータ) (2022-02-14T09:07:21Z) - Oriented Object Detection in Aerial Images Based on Area Ratio of
Parallelogram [0.0]
回転物体検出は空中画像において難しい課題である。
既存の回帰に基づく回転検出器は不連続境界の問題に悩まされる。
上記の課題に対処するためのシンプルな効果的な枠組みを提案する。
論文 参考訳(メタデータ) (2021-09-21T14:13:36Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Orienting Novel 3D Objects Using Self-Supervised Learning of Rotation
Transforms [22.91890127146324]
オブジェクト指向は、多くのパッキングやアセンブリタスクの自動化において重要なコンポーネントである。
我々は、四元数でパラメータ化された3次元回転を推定するために、ディープニューラルネットワークを訓練する。
次に、2つの深度画像間の推定回転に基づいて、トレーニングされたネットワークを比例制御器で再配置する。
論文 参考訳(メタデータ) (2021-05-29T08:22:55Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。