論文の概要: Deep Learning for Weakly-Supervised Object Detection and Object
Localization: A Survey
- arxiv url: http://arxiv.org/abs/2105.12694v1
- Date: Wed, 26 May 2021 17:15:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:25:58.488582
- Title: Deep Learning for Weakly-Supervised Object Detection and Object
Localization: A Survey
- Title(参考訳): 物体検出と物体位置推定のための深層学習:サーベイ
- Authors: Feifei Shao, Long Chen, Jian Shao, Wei Ji, Shaoning Xiao, Lu Ye,
Yueting Zhuang, Jun Xiao
- Abstract要約: Wakly-Supervised Object Detection (WSOD) と Localization (WSOL) は長年にわたるCVタスクである。
オブジェクト検出におけるディープニューラルネットワークの成功により、WSODとWSOLはどちらも前例のない注目を集めている。
深層学習時代には,WSOD法やWSOL法など数多くの技術が提案されている。
- 参考スコア(独自算出の注目度): 37.545083067084306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly-Supervised Object Detection (WSOD) and Localization (WSOL), i.e.,
detecting multiple and single instances with bounding boxes in an image using
image-level labels, are long-standing and challenging tasks in the CV
community. With the success of deep neural networks in object detection, both
WSOD and WSOL have received unprecedented attention. Hundreds of WSOD and WSOL
methods and numerous techniques have been proposed in the deep learning era. To
this end, in this paper, we consider WSOL is a sub-task of WSOD and provide a
comprehensive survey of the recent achievements of WSOD. Specifically, we
firstly describe the formulation and setting of the WSOD, including the
background, challenges, basic framework. Meanwhile, we summarize and analyze
all advanced techniques and training tricks for improving detection
performance. Then, we introduce the widely-used datasets and evaluation metrics
of WSOD. Lastly, we discuss the future directions of WSOD. We believe that
these summaries can help pave a way for future research on WSOD and WSOL.
- Abstract(参考訳): 弱教師付きオブジェクト検出(wsod)とローカライズ(wsol)、すなわちイメージレベルラベルを用いた画像内のバウンディングボックスによる複数インスタンスと単一インスタンスの検出は、cvコミュニティにおける長年の課題である。
オブジェクト検出におけるディープニューラルネットワークの成功により、WSODとWSOLはどちらも前例のない注目を集めている。
深層学習時代には,WSOD法やWSOL法など数多くの技術が提案されている。
そこで本稿では,wso は wsod のサブタスクであると考え,最近の wsod の成果を総合的に調査する。
具体的には、まず、背景、課題、基本的なフレームワークを含むWSODの定式化と設定を説明します。
一方,検出性能を向上させるための高度な技術や訓練手法を総括し,分析した。
次に、WSODの広く使われているデータセットと評価指標を紹介する。
最後に、WSODの今後の方向性について論じる。
これらの要約は、将来のWSODとWSOLの研究に役立つと考えています。
関連論文リスト
- Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Remote Sensing Object Detection Meets Deep Learning: A Meta-review of
Challenges and Advances [51.70835702029498]
本稿では,ディープラーニングに基づくRSOD手法の最近の成果を概観する。
RSODの主な課題として,マルチスケールオブジェクト検出,回転オブジェクト検出,弱いオブジェクト検出,小さなオブジェクト検出,限られた監視を伴うオブジェクト検出の5つを挙げる。
また、RSODの分野で広く使用されているベンチマークデータセットと評価指標、およびRSODのアプリケーションシナリオについてもレビューする。
論文 参考訳(メタデータ) (2023-09-13T06:48:32Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - A Survey on Open-Vocabulary Detection and Segmentation: Past, Present,
and Future [5.093388615302086]
タスクや方法論の種類に応じて分類法を開発する。
提案する分類法は, オブジェクト検出, セマンティック/インスタンス/パノプティックセグメンテーション, 3次元シーン, ビデオ理解など, さまざまなタスクにまたがって普遍的である。
論文 参考訳(メタデータ) (2023-07-18T12:52:49Z) - Boosting Weakly Supervised Object Detection using Fusion and Priors from
Hallucinated Depth [33.66537809438079]
弱教師付き物体検出(WSOD)の性能向上のための増幅器手法を提案する。
言語コンテキストと深さの関係を解析することにより、関心の対象を含む可能性のある境界ボックスの提案を識別するために、深さを計算します。
提案手法は,最新の2つのWSOD法上に実装することで,6つのデータセットに対して評価を行う。
論文 参考訳(メタデータ) (2023-03-20T08:26:29Z) - Recent Few-Shot Object Detection Algorithms: A Survey with Performance
Comparison [54.357707168883024]
Few-Shot Object Detection (FSOD)は、人間の学習能力を模倣する。
FSODは、学習した汎用オブジェクトの知識を共通のヘビーテールから新しいロングテールオブジェクトクラスにインテリジェントに転送する。
本稿では,問題定義,共通データセット,評価プロトコルなどを含むFSODの概要を紹介する。
論文 参考訳(メタデータ) (2022-03-27T04:11:28Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - A Survey of Deep Learning for Low-Shot Object Detection [44.20187548691372]
Low-Shot Object Detection (LSOD)は、アノテーション付きのサンプルからオブジェクトを検出する新しい研究トピックである。
本調査ではLSOD法について概観する。
論文 参考訳(メタデータ) (2021-12-06T06:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。