論文の概要: A Survey of Modern Deep Learning based Object Detection Models
- arxiv url: http://arxiv.org/abs/2104.11892v1
- Date: Sat, 24 Apr 2021 06:33:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 03:54:42.991875
- Title: A Survey of Modern Deep Learning based Object Detection Models
- Title(参考訳): 現代的深層学習に基づく物体検出モデルの検討
- Authors: Syed Sahil Abbas Zaidi, Mohammad Samar Ansari, Asra Aslam, Nadia
Kanwal, Mamoona Asghar, and Brian Lee
- Abstract要約: この記事では、ディープラーニングベースのオブジェクト検出器の最近の開発を調査します。
ベンチマークデータセットと検出に使用される評価メトリクスの概要を提供する。
また、エッジデバイスで使用される現代の軽量な分類モデルもカバーしている。
- 参考スコア(独自算出の注目度): 0.7388859384645263
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object Detection is the task of classification and localization of objects in
an image or video. It has gained prominence in recent years due to its
widespread applications. This article surveys recent developments in deep
learning based object detectors. Concise overview of benchmark datasets and
evaluation metrics used in detection is also provided along with some of the
prominent backbone architectures used in recognition tasks. It also covers
contemporary lightweight classification models used on edge devices. Lastly, we
compare the performances of these architectures on multiple metrics.
- Abstract(参考訳): オブジェクト検出は、画像やビデオ内のオブジェクトの分類とローカライゼーションのタスクである。
近年は広く普及しているため、広く普及している。
本稿では,ディープラーニングに基づく物体検出装置の最近の進歩について概説する。
検出に使用されるベンチマークデータセットと評価指標の簡潔な概要と、認識タスクで使用される著名なバックボーンアーキテクチャも提供される。
また、エッジデバイスで使用される現代的な軽量分類モデルもカバーしている。
最後に、これらのアーキテクチャのパフォーマンスを複数のメトリクスで比較する。
関連論文リスト
- Towards Reflected Object Detection: A Benchmark [5.981658448641905]
本稿では,反射物体検出に特化して設計されたベンチマークを紹介する。
我々のリフレクションオブジェクト検出データセット(RODD)は、様々なコンテキストにおいて反射オブジェクトを示す多様な画像のコレクションを特徴としている。
RODDは10のカテゴリを包含し、異なる背景にまたがる21,059のリアルおよびリフレクションオブジェクトの画像を含んでいる。
論文 参考訳(メタデータ) (2024-07-08T03:16:05Z) - The Impact of Different Backbone Architecture on Autonomous Vehicle
Dataset [120.08736654413637]
バックボーンアーキテクチャによって抽出された特徴の質は、全体的な検出性能に大きな影響を与える可能性がある。
本研究は,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
論文 参考訳(メタデータ) (2023-09-15T17:32:15Z) - On Hyperbolic Embeddings in 2D Object Detection [76.12912000278322]
双曲幾何学が対象分類空間の基盤構造に適合するかどうかを考察する。
2段階、キーポイントベース、トランスフォーマーベースオブジェクト検出アーキテクチャに双曲型分類器を組み込む。
分類空間の構造に現れる分類階級階層を観察し、分類誤差を低くし、全体的な対象検出性能を高める。
論文 参考訳(メタデータ) (2022-03-15T16:43:40Z) - Few-Shot Object Detection: A Survey [4.266990593059534]
オブジェクト検出は、ターゲットドメイン内の新しいカテゴリの少数のオブジェクトインスタンスから学ぶことを目的としている。
トレーニング手法とアーキテクチャレイアウトに応じてアプローチを分類する。
一般的なデータセットとその評価プロトコルを導入し,ベンチマーク結果を解析する。
論文 参考訳(メタデータ) (2021-12-22T07:08:53Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Class-agnostic Object Detection [16.97782147401037]
本稿では,オブジェクトのクラスに関係なくオブジェクトを検出することに焦点を当てた新しい問題として,クラスに依存しないオブジェクト検出を提案する。
具体的には、イメージ内のすべてのオブジェクトのバウンディングボックスを予測することであり、オブジェクトクラスではない。
本稿では,この領域における今後の研究を進めるために,クラス非依存検出器のベンチマークのためのトレーニングおよび評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-28T19:22:38Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Cross-Supervised Object Detection [42.783400918552765]
完全ラベル付きベースカテゴリから学習した知識を活用して、新しいカテゴリの弱いラベル付き画像からより良いオブジェクト検出器を構築する方法を示す。
本稿では,インスタンスレベルのアノテーションから学習した検出ヘッドと,画像レベルのアノテーションから学習した認識ヘッドを組み合わせた統合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-26T15:33:48Z) - Look-into-Object: Self-supervised Structure Modeling for Object
Recognition [71.68524003173219]
我々は,自己スーパービジョンを取り入れた「対象」(具体的かつ内在的に対象構造をモデル化する)を提案する。
認識バックボーンは、より堅牢な表現学習のために大幅に拡張可能であることを示す。
提案手法は汎用オブジェクト認識(ImageNet)や細粒度オブジェクト認識タスク(CUB, Cars, Aircraft)など,多数のベンチマークにおいて大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-03-31T12:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。