論文の概要: Rethinking the Aligned and Misaligned Features in One-stage Object
Detection
- arxiv url: http://arxiv.org/abs/2108.12176v1
- Date: Fri, 27 Aug 2021 08:40:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:13:48.714096
- Title: Rethinking the Aligned and Misaligned Features in One-stage Object
Detection
- Title(参考訳): 一段階物体検出におけるアライメントとアライメントの相違について
- Authors: Yang Yang, Min Li, Bo Meng, Junxing Ren, Degang Sun, Zihao Huang
- Abstract要約: 1段階の物体検出器は、検出結果を予測するために点特徴に依存する。
タスク毎に整列および非整合性を生成できるシンプルでプラグイン演算子を提案する。
OAT(object-aligned and task-disentangled operator)に基づくOAT-Netを提案する。
- 参考スコア(独自算出の注目度): 9.270523894683278
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One-stage object detectors rely on the point feature to predict the detection
results. However, the point feature may lack the information of the whole
object and lead to a misalignment between the object and the point feature.
Meanwhile, the classification and regression tasks are sensitive to different
object regions, but their features are spatially aligned. In this paper, we
propose a simple and plug-in operator that could generate aligned and
disentangled features for each task, respectively, without breaking the fully
convolutional manner. By predicting two task-aware point sets that are located
in each sensitive region, this operator could disentangle the two tasks from
the spatial dimension, as well as align the point feature with the object. We
also reveal an interesting finding of the opposite effect of the long-range
skip-connection for classification and regression, respectively. Based on the
object-aligned and task-disentangled operator (OAT), we propose OAT-Net, which
explicitly exploits point-set features for more accurate detection results.
Extensive experiments on the MS-COCO dataset show that OAT can consistently
boost different one-stage detectors by $\sim$2 AP. Notably, OAT-Net achieves
53.7 AP with Res2Net-101-DCN backbone and shows promising performance gain for
small objects.
- Abstract(参考訳): 1段階の物体検出器は、検出結果を予測するために点特徴に依存する。
しかし、ポイントフィーチャは、オブジェクト全体の情報を欠く可能性があり、オブジェクトとポイントフィーチャの間のミスアライメントにつながります。
一方、分類と回帰タスクは異なる対象領域に敏感であるが、それらの特徴は空間的に整列している。
本稿では,完全畳み込み方式を壊さずに,各タスクの整列および非整合性をそれぞれ生成できる,シンプルかつプラグイン演算子を提案する。
各センシティブな領域に存在する2つのタスク認識ポイントセットを予測することにより、このオペレータは2つのタスクを空間次元から切り離し、ポイント特徴をオブジェクトに合わせることができる。
また,分類と回帰に対する長距離スキップ接続の逆効果の興味深い発見も明らかにした。
oat(object-aligned and task-disentangled operator)に基づいて、より正確な検出結果のためにポイントセット機能を明示的に活用するoot-netを提案する。
MS-COCOデータセットの大規模な実験により、OATは$\sim$2 APで異なる1段検出器を継続的に強化できることが示された。
特に、OAT-NetはRes2Net-101-DCNバックボーンで53.7 APを達成した。
関連論文リスト
- Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - PointOBB: Learning Oriented Object Detection via Single Point
Supervision [55.88982271340328]
本稿では,オブジェクト指向物体検出のための最初の単一点ベース OBB 生成法である PointOBB を提案する。
PointOBBは、オリジナルビュー、リサイズビュー、ローテーション/フリップ(rot/flp)ビューの3つのユニークなビューの協調利用を通じて動作する。
DIOR-RとDOTA-v1.0データセットの実験結果は、PointOBBが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2023-11-23T15:51:50Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - ARS-DETR: Aspect Ratio-Sensitive Detection Transformer for Aerial Oriented Object Detection [55.291579862817656]
既存のオブジェクト指向オブジェクト検出手法では、モデルの性能を測定するために計量AP$_50$が一般的である。
我々は、AP$_50$は本来、角度偏差に大きな耐性があるため、オブジェクト指向物体検出には適さないと主張している。
本稿では,ARS-DETR(Aspect Ratio Sensitive Oriented Object Detector with Transformer)を提案する。
論文 参考訳(メタデータ) (2023-03-09T02:20:56Z) - Improving Object Detection and Attribute Recognition by Feature
Entanglement Reduction [26.20319853343761]
オブジェクト検出は属性非依存であるべきであり、属性は主にオブジェクト非依存であることを示す。
我々は、カテゴリと属性の特徴を独立に計算する2ストリームモデルを用いて、それらを分離するが、分類ヘッドは興味の領域(RoIs)を共有する。
従来のシングルストリームモデルと比較すると,Visual GenomeのサブセットであるVG-20よりも,教師付きタスクと属性転送タスクにおいて大幅な改善が見られた。
論文 参考訳(メタデータ) (2021-08-25T22:27:06Z) - TOOD: Task-aligned One-stage Object Detection [41.43371563426291]
1段階の物体検出は、オブジェクト分類と局所化の2つのサブタスクを最適化することで一般的に実装される。
本稿では,2つのタスクを学習ベースで明示的に整列するタスク整列1段階オブジェクト検出(TOOD)を提案する。
実験はMS-COCOで行われ、TOODはシングルモデル単スケールテストで51.1 APを達成した。
論文 参考訳(メタデータ) (2021-08-17T17:00:01Z) - Points as Queries: Weakly Semi-supervised Object Detection by Points [25.286468630229592]
ポイントエンコーダを追加してDETRを拡張する新しい検出器、Point DETRを紹介します。
特に、COCOから20%のラベル付きデータを使用する場合、検知器は33.3 APという有望な性能を達成する。
論文 参考訳(メタデータ) (2021-04-15T13:08:25Z) - Decoupled Self Attention for Accurate One Stage Object Detection [4.791635488070342]
本稿では,1段階の物体検出モデルに対してデカップリング自己注意(DSA)モジュールを提案する。
DSAモジュールのネットワークは単純だが、オブジェクト検出の性能を効果的に向上させることができるが、多くの検出モデルに組み込むこともできる。
論文 参考訳(メタデータ) (2020-12-14T15:19:30Z) - AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection [8.39479809973967]
Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器の学習を目的としている。
既存の方法では、共有コンポーネントを用いて分類と局所化のサブタスクを実行することで、この問題を解決している。
本稿では,2つのサブタスクの明示的な分解を考慮し,両者の情報を活用して特徴表現の強化を図ることを提案する。
論文 参考訳(メタデータ) (2020-11-30T10:21:32Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection [170.30694322460045]
我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
論文 参考訳(メタデータ) (2020-01-18T15:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。