論文の概要: Two-phase weakly supervised object detection with pseudo ground truth
mining
- arxiv url: http://arxiv.org/abs/2104.00231v1
- Date: Thu, 1 Apr 2021 03:21:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 13:42:19.741665
- Title: Two-phase weakly supervised object detection with pseudo ground truth
mining
- Title(参考訳): 擬似地層真理採掘による二相弱教師対象検出
- Authors: Jun Wang
- Abstract要約: 画像レベルのデータセットのみを用いて検出器を訓練することを目的としたweakly supervised object detection (wsod) が研究者の注目を集めている。
本プロジェクトでは,強力な検出器と純粋なwsodモデルを統合する2相wsodアーキテクチャに焦点を当てる。
2相WSODにおける第2相検出器として用いられる代表検出器の有効性について検討し,2相WSODアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 8.227822364332814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Object Detection (WSOD), aiming to train detectors with
only image-level dataset, has arisen increasing attention for researchers. In
this project, we focus on two-phase WSOD architecture which integrates a
powerful detector with a pure WSOD model. We explore the effectiveness of some
representative detectors utilized as the second-phase detector in two-phase
WSOD and propose a two-phase WSOD architecture. In addition, we present a
strategy to establish the pseudo ground truth (PGT) used to train the
second-phase detector. Unlike previous works that regard top one bounding boxes
as PGT, we consider more bounding boxes to establish the PGT annotations. This
alleviates the insufficient learning problem caused by the low recall of PGT.
We also propose some strategies to refine the PGT during the training of the
second detector. Our strategies suspend the training in specific epoch, then
refine the PGT by the outputs of the second-phase detector. After that, the
algorithm continues the training with the same gradients and weights as those
before suspending. Elaborate experiments are conduceted on the PASCAL VOC 2007
dataset to verify the effectiveness of our methods. As results demonstrate, our
two-phase architecture improves the mAP from 49.17% to 53.21% compared with the
single PCL model. Additionally, the best PGT generation strategy obtains a 0.7%
mAP increment. Our best refinement strategy boosts the performance by 1.74%
mAP. The best results adopting all of our methods achieve 55.231% mAP which is
the state-of-the-art performance.
- Abstract(参考訳): 画像レベルのデータセットのみを用いて検出器を訓練することを目的としたweakly supervised object detection(wsod)は、研究者の注目を集めている。
本プロジェクトでは,強力な検出器と純粋なwsodモデルを統合する2相wsodアーキテクチャに焦点を当てる。
2相WSODにおける第2相検出器として用いられる代表検出器の有効性について検討し,2相WSODアーキテクチャを提案する。
さらに,第2相検出器の訓練に用いる擬似基底真理(PGT)を確立するための戦略を提案する。
上位1つの境界ボックスをPGTとみなす以前の研究とは異なり、我々はPGTアノテーションを確立するためにより多くの境界ボックスを考える。
これにより、PGTの低リコールに起因する学習問題が軽減される。
また,第2検出器の訓練中にPGTを改良する戦略を提案する。
我々の戦略は、特定の時期における訓練を中断し、第2相検出器の出力によってpgtを精錬する。
その後、アルゴリズムは、サスペンション前と同じ勾配と重みでトレーニングを継続する。
本手法の有効性を検証するため,PASCAL VOC 2007データセットを用いて実験を行った。
その結果,二相構造は単一pclモデルと比較して49.17%から53.21%に改善した。
さらに、最高PGT生成戦略は0.7%のmAPインクリメントを得る。
最高のリファインメント戦略は、パフォーマンスを1.74%向上させる。
これらの手法を全て適用した最良の結果は55.231% mAPであり、これは最先端のパフォーマンスである。
関連論文リスト
- ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークが組み込まれている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - Simplifying Two-Stage Detectors for On-Device Inference in Remote Sensing [0.7305342793164903]
本研究では,2段階物体検出器のモデル簡易化手法を提案する。
本手法は,DOTAv1.5データセットの2.1%以内の精度で計算コストを61.2%まで削減する。
論文 参考訳(メタデータ) (2024-04-11T00:45:10Z) - Advanced Efficient Strategy for Detection of Dark Objects Based on
Spiking Network with Multi-Box Detection [2.9659663708260777]
本研究は,エネルギー効率および信頼性の高い物体検出器モデルとして,スパイク層と通常の畳み込み層の組み合わせを提案する。
最先端のPythonライブラリでは、スパイク層を効率的にトレーニングすることができる。
提案したスパイク畳み込みオブジェクト検出器 (SCOD) はVOCおよびEx-Darkデータセット上で評価されている。
論文 参考訳(メタデータ) (2023-10-10T07:20:37Z) - Enhancing Infrared Small Target Detection Robustness with Bi-Level
Adversarial Framework [61.34862133870934]
本稿では,異なる汚職の存在下での検出の堅牢性を促進するために,二段階の対向的枠組みを提案する。
我々の手法は広範囲の汚職で21.96%のIOUを著しく改善し、特に一般ベンチマークで4.97%のIOUを推進している。
論文 参考訳(メタデータ) (2023-09-03T06:35:07Z) - Boosting the Efficiency of Parametric Detection with Hierarchical Neural
Networks [4.1410005218338695]
高速検出のための新しい手法として階層型検出ネットワーク(HDN)を提案する。
ネットワークは、統計的精度と効率の目標を同時に符号化する新しい損失関数を用いて訓練される。
2層モデルを用いた3層HDNのトレーニングにより,精度と効率が向上することを示す。
論文 参考訳(メタデータ) (2022-07-23T19:23:00Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - PGTRNet: Two-phase Weakly Supervised Object Detection with Pseudo Ground
Truth Refining [10.262660606897974]
画像レベルのアノテーションだけで検知器を訓練することを目的とした弱い監視対象検出(WSOD)が注目されている。
現在の最先端のアプローチは、主に2段階のトレーニング戦略に従い、完全な教師付き検出器(FSD)と純粋なWSODモデルを統合する。
2相WSODアプローチの性能を阻害する主な問題は2つある。すなわち、不十分な学習問題と、WSODモデルによって生成されたFSDと擬似基底真理との厳密な依存である。
本稿では, 単純かつ効果的な手法である擬似基底真理改善ネットワーク(PGTRNet)を提案する。
論文 参考訳(メタデータ) (2021-08-25T19:20:49Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。