論文の概要: Multi-Grid Redundant Bounding Box Annotation for Accurate Object
Detection
- arxiv url: http://arxiv.org/abs/2201.01857v1
- Date: Wed, 5 Jan 2022 23:01:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-07 14:53:11.927120
- Title: Multi-Grid Redundant Bounding Box Annotation for Accurate Object
Detection
- Title(参考訳): 高精度物体検出のためのマルチグリッド冗長境界ボックスアノテーション
- Authors: Solomon Negussie Tesema, El-Bay Bourennane
- Abstract要約: YOLOv3は、入力画像を取り込み、それを同じ大きさのグリッドマトリックスに分割する最先端のワンショット検出器である。
本稿では,オブジェクト毎に複数のグリッドを割り当て,厳密な境界ボックス予測を行う数学的手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern leading object detectors are either two-stage or one-stage networks
repurposed from a deep CNN-based backbone classifier network. YOLOv3 is one
such very-well known state-of-the-art one-shot detector that takes in an input
image and divides it into an equal-sized grid matrix. The grid cell having the
center of an object is the one responsible for detecting the particular object.
This paper presents a new mathematical approach that assigns multiple grids per
object for accurately tight-fit bounding box prediction. We also propose an
effective offline copy-paste data augmentation for object detection. Our
proposed method significantly outperforms some current state-of-the-art object
detectors with a prospect for further better performance.
- Abstract(参考訳): 現代のリードオブジェクト検出器は、ディープCNNベースのバックボーン分類器ネットワークから再利用可能な2段階または1段階のネットワークである。
YOLOv3は、入力画像を取り込んで同じ大きさのグリッドマトリックスに分割する、非常によく知られた最先端のワンショット検出器である。
オブジェクトの中心を持つグリッドセルは、特定のオブジェクトを検出する責任がある。
本稿では,オブジェクト毎に複数のグリッドを割り当て,厳密な境界ボックス予測を行う数学的手法を提案する。
また,オブジェクト検出のための効果的なオフラインコピーペーストデータ拡張を提案する。
提案手法は, 現状の物体検出器よりも大幅に優れており, さらなる性能向上が期待できる。
関連論文リスト
- Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Linear Object Detection in Document Images using Multiple Object
Tracking [58.720142291102135]
線形オブジェクトは文書構造に関する実質的な情報を伝達する。
多くのアプローチはベクトル表現を復元できるが、1994年に導入された1つのクローズドソース技術のみである。
複数オブジェクト追跡を用いた文書画像中の線形オブジェクトの正確なインスタンスセグメンテーションのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-26T14:22:03Z) - Object Detection in Aerial Images with Uncertainty-Aware Graph Network [61.02591506040606]
本稿では,ノードとエッジがオブジェクトによって表現される構造化グラフを用いた,新しい不確実性を考慮したオブジェクト検出フレームワークを提案する。
我々は我々のモデルをオブジェクトDETection(UAGDet)のための不確実性対応グラフネットワークと呼ぶ。
論文 参考訳(メタデータ) (2022-08-23T07:29:03Z) - Double-Dot Network for Antipodal Grasp Detection [20.21384585441404]
本稿では,Double-Dot Network (DD-Net) という,対足足歩行検出のための新しい深層学習手法を提案する。
これは、経験的にプリセットされたアンカーに依存しない最近のアンカーフリーなオブジェクト検出フレームワークに従っている。
このような指先をローカライズするために効果的なCNNアーキテクチャを導入し、改良のための補助センターの助けを借りて、把握候補を正確かつ堅牢に推測する。
論文 参考訳(メタデータ) (2021-08-03T14:21:17Z) - Single Object Tracking through a Fast and Effective Single-Multiple
Model Convolutional Neural Network [0.0]
最近の最先端の(SOTA)アプローチは、エリア内の他のオブジェクトとターゲットを区別するために重い構造を持つマッチングネットワークを取ることに基づいて提案されています。
本稿では,これまでのアプローチとは対照的に,一つのショットで物体の位置を識別できる特殊なアーキテクチャを提案する。
提示されたトラッカーは、1080tiで最大120 fps$の超高速で、挑戦的な状況でsomaと比較してパフォーマンスする。
論文 参考訳(メタデータ) (2021-03-28T11:02:14Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - IterDet: Iterative Scheme for Object Detection in Crowded Environments [6.2997667081978825]
ディープラーニングベースの検出器は通常、冗長なオブジェクト境界ボックスを生成する。
これらのボックスは、興味のある対象ごとに正確に1つのバウンディングボックスを選択するために、NMS(Non-maximum suppress)を使用してフィルタリングされる。
この欲求スキームは単純で、孤立したオブジェクトに対して十分な精度を提供するが、しばしば混み合った環境で失敗する。
本研究では、各イテレーションで新しいオブジェクトのサブセットを検出する、代替的な反復スキームを開発する。
論文 参考訳(メタデータ) (2020-05-12T12:04:27Z) - Detective: An Attentive Recurrent Model for Sparse Object Detection [25.5804429439316]
ディテクティヴ(英: Detective)は、画像中の物体を連続的に識別する注意オブジェクト検出器である。
Detectiveはスパースオブジェクト検出器で、オブジェクトインスタンス毎に単一のバウンディングボックスを生成する。
ハンガリーのアルゴリズムに基づく学習機構と,局所化と分類タスクのバランスをとる損失を提案する。
論文 参考訳(メタデータ) (2020-04-25T17:41:52Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。