論文の概要: DFAM-DETR: Deformable feature based attention mechanism DETR on slender
object detection
- arxiv url: http://arxiv.org/abs/2204.10667v1
- Date: Fri, 22 Apr 2022 12:31:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-25 13:45:49.969874
- Title: DFAM-DETR: Deformable feature based attention mechanism DETR on slender
object detection
- Title(参考訳): DFAM-DETR:細い物体検出における変形可能な特徴に基づく注意機構DETR
- Authors: Wen Feng, Wang Mei, Hu Xiaojie
- Abstract要約: CNNはオブジェクト検出に広く利用されているが、固定された幾何構造とサンプリングポイントのために細いオブジェクト検出では不十分である。
我々は、細い物体の検出精度と効率を高めるために、変形可能な特徴に基づく注意機構(DFAM)を提案する。
- 参考スコア(独自算出の注目度): 0.46040036610482665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection is one of the most significant aspects of computer vision,
and it has achieved substantial results in a variety of domains. It is worth
noting that there are few studies focusing on slender object detection. CNNs
are widely employed in object detection, however it performs poorly on slender
object detection due to the fixed geometric structure and sampling points. In
comparison, Deformable DETR has the ability to obtain global to specific
features. Even though it outperforms the CNNs in slender objects detection
accuracy and efficiency, the results are still not satisfactory. Therefore, we
propose Deformable Feature based Attention Mechanism (DFAM) to increase the
slender object detection accuracy and efficiency of Deformable DETR. The DFAM
has adaptive sampling points of deformable convolution and attention mechanism
that aggregate information from the entire input sequence in the backbone
network. This improved detector is named as Deformable Feature based Attention
Mechanism DETR (DFAM- DETR). Results indicate that DFAM-DETR achieves
outstanding detection performance on slender objects.
- Abstract(参考訳): 物体検出はコンピュータビジョンの最も重要な側面の1つであり、様々な領域において大きな成果を上げている。
細い物体の検出に焦点を当てた研究はほとんどない。
CNNはオブジェクト検出に広く利用されているが、固定された幾何構造とサンプリングポイントのために細いオブジェクト検出では不十分である。
対照的に、Deformable DETRはグローバルから特定の機能を得ることができる。
細長い物体の検出精度と効率ではcnnを上回っているが、結果はまだ満足できない。
そこで我々は,変形可能なdetrの細長い物体検出精度と効率を向上させるために,変形可能な特徴に基づく注意機構(dfam)を提案する。
DFAMは、バックボーンネットワークの入力シーケンス全体から情報を集約する変形可能な畳み込みとアテンション機構の適応サンプリングポイントを有する。
この改良された検出器はDeformable Feature based Attention Mechanism DETR (DFAM-DETR) と名付けられた。
その結果,DFAM-DETRは細い物体に対して優れた検出性能を発揮することがわかった。
関連論文リスト
- RotaTR: Detection Transformer for Dense and Rotated Object [0.49764328892172144]
指向性検出へのDETRの拡張として,回転物体検出TRansformer(RotaTR)を提案する。
具体的には、DTRの指向目標検出能力を高めるために、回転感度変形(RSDeform)アテンションを設計する。
RotaTRは、元のDETRと比較して密度と向きの強い物体を検出するのに大きな利点を示している。
論文 参考訳(メタデータ) (2023-12-05T15:06:04Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [21.96072831561483]
本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - Bridging the Performance Gap between DETR and R-CNN for Graphical Object
Detection in Document Images [11.648151981111436]
本稿では,DTRとR-CNNのパフォーマンスギャップを図形オブジェクト検出のために橋渡しする重要なステップを踏む。
異なる方法でオブジェクトクエリを変更し、ポイントを使用し、アンカーボックスを使用し、パフォーマンスを高めるためにアンカーに正と負のノイズを追加します。
我々は、PubTables、TableBank、NTable、PubLaynetの4つのグラフデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-06-23T14:46:03Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Object Detection in Aerial Images with Uncertainty-Aware Graph Network [61.02591506040606]
本稿では,ノードとエッジがオブジェクトによって表現される構造化グラフを用いた,新しい不確実性を考慮したオブジェクト検出フレームワークを提案する。
我々は我々のモデルをオブジェクトDETection(UAGDet)のための不確実性対応グラフネットワークと呼ぶ。
論文 参考訳(メタデータ) (2022-08-23T07:29:03Z) - Real-World Semantic Grasping Detection [0.34410212782758054]
本稿では,意味認識と把握検出を両立できるエンドツーエンドのセマンティック把握検出モデルを提案する。
また,検出を把握するためのセマンティック情報に基づき,単一のオブジェクトの特徴のみを保持するターゲット特徴フィルタリング機構を設計する。
実験結果から,コーネルグルーピングデータセットの98.38%の精度が得られた。
論文 参考訳(メタデータ) (2021-11-20T05:57:22Z) - DA-DETR: Domain Adaptive Detection Transformer with Information Fusion [53.25930448542148]
DA-DETRは、ラベル付きソースドメインからラベルなしターゲットドメインへの効果的な転送のための情報融合を導入するドメイン適応型オブジェクト検出変換器である。
本稿では,CNN機能とトランスフォーマー機能を融合した新しいCNN-Transformer Blender(CTBlender)を提案する。
CTBlenderはTransformer機能を使用して、高レベルの意味情報と低レベルの空間情報が融合した複数のスケールでCNN機能を変調し、正確な物体識別と位置決めを行う。
論文 参考訳(メタデータ) (2021-03-31T13:55:56Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。