論文の概要: Phase-Shifting Coder: Predicting Accurate Orientation in Oriented Object
Detection
- arxiv url: http://arxiv.org/abs/2211.06368v1
- Date: Fri, 11 Nov 2022 17:31:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 16:43:04.759923
- Title: Phase-Shifting Coder: Predicting Accurate Orientation in Oriented Object
Detection
- Title(参考訳): 位相シフトコーダ:オブジェクト指向物体検出における正確な方向予測
- Authors: Yi Yu and Feipeng Da
- Abstract要約: 物体の向きを正確に予測するために、位相シフトコーダ(PSC)と呼ばれる新しい微分可能な角度コーダを提案する。
オブジェクト指向物体検出における様々な周期的ファジィ問題に対する統一的なフレームワークを提供する。
3つのデータセットの視覚的分析と実験は、我々のアプローチの有効性と可能性を証明する。
- 参考スコア(独自算出の注目度): 10.99534239215483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the vigorous development of computer vision, oriented object detection
has gradually been featured. In this paper, a novel differentiable angle coder
named phase-shifting coder (PSC) is proposed to accurately predict the
orientation of objects, along with a dual-frequency version PSCD. By mapping
rotational periodicity of different cycles into phase of different frequencies,
we provide a unified framework for various periodic fuzzy problems in oriented
object detection. Upon such framework, common problems in oriented object
detection such as boundary discontinuity and square-like problems are elegantly
solved in a unified form. Visual analysis and experiments on three datasets
prove the effectiveness and the potentiality of our approach. When facing
scenarios requiring high-quality bounding boxes, the proposed methods are
expected to give a competitive performance. The codes are publicly available at
https://github.com/open-mmlab/mmrotate.
- Abstract(参考訳): コンピュータビジョンの活発な発展に伴い、指向性物体検出が徐々に注目されるようになった。
本稿では,二周波バージョンPSCDとともに,物体の向きを正確に予測する新しい位相シフトコーダ(PSC)を提案する。
異なる周期の回転周期性を異なる周波数の位相にマッピングすることにより、オブジェクト指向物体検出における様々な周期的ファジィ問題に対する統一的な枠組みを提供する。
このような枠組みでは、境界の不連続性や正方形の問題といったオブジェクト指向物体検出の一般的な問題は、統一形式でエレガントに解決される。
3つのデータセットの視覚分析と実験は、我々のアプローチの有効性と可能性を証明する。
高品質なバウンディングボックスを必要とするシナリオに直面した場合、提案手法は競合性能が期待できる。
コードはhttps://github.com/open-mmlab/mmrotateで公開されている。
関連論文リスト
- OrientedFormer: An End-to-End Transformer-Based Oriented Object Detector in Remote Sensing Images [26.37802649901314]
リモートセンシング画像におけるオブジェクト指向物体検出は、複数方向のオブジェクトが分散しているため、難しい課題である。
これらの問題に対処する3つの専用モジュールからなるエンドツーエンドのトランスフォーマベース指向オブジェクト検出器を提案する。
従来のエンドツーエンド検出器と比較して、OrientedFormerはDIOR-RとDOTA-v1.0でそれぞれ1.16および1.21 AP$_50$を獲得し、トレーニングエポックを3$times$から1$times$に下げる。
論文 参考訳(メタデータ) (2024-09-29T10:36:33Z) - DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection [42.70285733630796]
赤外可視物体検出は、赤外と可視画像の相補的な情報を活用することにより、堅牢な物体検出を実現することを目的としている。
相補的特徴の融合は困難であり、現在の手法では相補的条件下での両モードの物体の正確な検出はできない。
これらの問題に対処するための分離位置検出変換器を提案する。
DroneVehicleとKAISTデータセットの実験は、他の最先端の方法と比較して大幅に改善されている。
論文 参考訳(メタデータ) (2024-08-12T13:05:43Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Rethinking Boundary Discontinuity Problem for Oriented Object Detection [42.136448033031634]
最先端のIoUライクな手法でさえ境界不連続問題を解くことができないことを示す。
既存のIoUライクな手法では、このモデルは基本的に箱と物体の間の角関係を適合させようとするが、そこでは角境界のブレークポイントが予測を非常に不安定にする。
そこで我々は, 可逆性と結合最適化を, 単一の平滑化関数から2つの異なるエンティティに分離し, 角境界補正と他のパラメータとのブレンディングの両目的を初めて達成する。
論文 参考訳(メタデータ) (2023-05-17T09:04:22Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。