論文の概要: Online Active Proposal Set Generation for Weakly Supervised Object
Detection
- arxiv url: http://arxiv.org/abs/2101.07929v1
- Date: Wed, 20 Jan 2021 02:20:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 01:26:18.447066
- Title: Online Active Proposal Set Generation for Weakly Supervised Object
Detection
- Title(参考訳): 弱教師付き物体検出のためのオンラインアクティブ提案セット生成
- Authors: Ruibing Jin, Guosheng Lin, and Changyun Wen
- Abstract要約: 弱い教師付きオブジェクト検出メソッドはイメージレベルのアノテーションのみを必要とする。
オンライン提案サンプリングはこれらの問題に対する直感的な解決策である。
提案アルゴリズムは, PASCAL VOC 2007 と 2012 の両データセットに対して一貫した, 有意な改善を示した。
- 参考スコア(独自算出の注目度): 41.385545249520696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To reduce the manpower consumption on box-level annotations, many weakly
supervised object detection methods which only require image-level annotations,
have been proposed recently. The training process in these methods is
formulated into two steps. They firstly train a neural network under weak
supervision to generate pseudo ground truths (PGTs). Then, these PGTs are used
to train another network under full supervision. Compared with fully supervised
methods, the training process in weakly supervised methods becomes more complex
and time-consuming. Furthermore, overwhelming negative proposals are involved
at the first step. This is neglected by most methods, which makes the training
network biased towards to negative proposals and thus degrades the quality of
the PGTs, limiting the training network performance at the second step. Online
proposal sampling is an intuitive solution to these issues. However, lacking of
adequate labeling, a simple online proposal sampling may make the training
network stuck into local minima. To solve this problem, we propose an Online
Active Proposal Set Generation (OPG) algorithm. Our OPG algorithm consists of
two parts: Dynamic Proposal Constraint (DPC) and Proposal Partition (PP). DPC
is proposed to dynamically determine different proposal sampling strategy
according to the current training state. PP is used to score each proposal,
part proposals into different sets and generate an active proposal set for the
network optimization. Through experiments, our proposed OPG shows consistent
and significant improvement on both datasets PASCAL VOC 2007 and 2012, yielding
comparable performance to the state-of-the-art results.
- Abstract(参考訳): ボックスレベルのアノテーションの消費電力を減らすため,画像レベルのアノテーションのみを必要とする弱教師付きオブジェクト検出法が近年提案されている。
これらの方法のトレーニングプロセスを2つのステップに定式化する。
まず、弱い監督下でニューラルネットワークをトレーニングし、擬似基底真理(PGT)を生成する。
そして、これらのPGTは、完全な監視下で別のネットワークをトレーニングするために使用される。
完全教師付き手法と比較して、弱教師付き手法の訓練プロセスはより複雑で時間がかかる。
さらに、最初の段階では圧倒的な否定的な提案が絡み合っている。
これはほとんどの手法で無視されており、トレーニングネットワークは負の提案に偏り、PGTの品質が低下し、トレーニングネットワークの性能が2番目のステップで制限される。
オンライン提案サンプリングはこれらの問題に対する直感的な解決策である。
しかし、適切なラベル付けがないため、簡単なオンライン提案サンプリングにより、トレーニングネットワークをローカルなミニマに固定することができる。
そこで本研究では,オンラインアクティブ・プロポーザル・セット生成(OPG)アルゴリズムを提案する。
提案アルゴリズムは動的提案制約 (DPC) と提案分割 (PP) の2つの部分から構成される。
DPCは、現在のトレーニング状況に応じて異なる提案サンプリング戦略を動的に決定する。
PPは各提案をスコアリングし、提案を異なるセットに分割し、ネットワーク最適化のためのアクティブな提案セットを生成する。
実験により,提案したOPGは, PASCAL VOC 2007 と 2012 の両データセットに対して一貫した, 有意な改善を示した。
関連論文リスト
- Prospect Pruning: Finding Trainable Weights at Initialization using
Meta-Gradients [36.078414964088196]
初期化時にニューラルネットワークをプルーニングすることで、元のネットワークの精度を保ったスパースモデルを見つけることができる。
現在の方法は、この最適化を可能にするには不十分であり、モデル性能の大幅な低下につながります。
提案するProspect Pruning(ProsPr)は,最適化の最初の数ステップを通じてメタグラディエントを用いて,どの重み付けを行うかを決定する。
本手法は,従来のプルーニング・アット・初期化手法と比較して,データの少ない1ショットで,様々な視覚分類タスクにおける最先端のプルーニング性能を実現する。
論文 参考訳(メタデータ) (2022-02-16T15:18:55Z) - ProposalCLIP: Unsupervised Open-Category Object Proposal Generation via
Exploiting CLIP Cues [49.88590455664064]
ProposalCLIPはアノテーションなしでさまざまなオブジェクトカテゴリの提案を予測できる。
提案CLIPはまた、教師なしオブジェクト検出のような下流タスクの利点を示す。
論文 参考訳(メタデータ) (2022-01-18T01:51:35Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Contrastive Proposal Extension with LSTM Network for Weakly Supervised
Object Detection [52.86681130880647]
画像レベルのラベルしか使用せず、膨大なアノテーションコストを節約できるため、WSOD (Weakly supervised Object Detection) が注目されている。
本稿では,初期提案と拡張提案を比較して,初期提案を最適化する手法を提案する。
PASCAL VOC 2007 と VOC 2012 と MS-COCO のデータセットを用いた実験により,本手法は最先端の結果を得た。
論文 参考訳(メタデータ) (2021-10-14T16:31:57Z) - Natural Language Video Localization with Learnable Moment Proposals [40.91060659795612]
学習可能なモーメントの提案を固定したLPNet(Learnable Proposal Network for NLVL)と呼ばれる新しいモデルを提案する。
本稿では,既存の最先端手法に対するLPNetの有効性を示す。
論文 参考訳(メタデータ) (2021-09-22T12:18:58Z) - Adaptive Proposal Generation Network for Temporal Sentence Localization
in Videos [58.83440885457272]
ビデオ(TSLV)における時間文ローカライゼーションの問題に対処する。
従来のメソッドは、事前に定義されたセグメントの提案でターゲットセグメントをローカライズするトップダウンフレームワークに従っている。
本稿では,効率を向上しつつセグメントレベルの相互作用を維持するための適応提案生成ネットワーク(APGN)を提案する。
論文 参考訳(メタデータ) (2021-09-14T02:02:36Z) - PGTRNet: Two-phase Weakly Supervised Object Detection with Pseudo Ground
Truth Refining [10.262660606897974]
画像レベルのアノテーションだけで検知器を訓練することを目的とした弱い監視対象検出(WSOD)が注目されている。
現在の最先端のアプローチは、主に2段階のトレーニング戦略に従い、完全な教師付き検出器(FSD)と純粋なWSODモデルを統合する。
2相WSODアプローチの性能を阻害する主な問題は2つある。すなわち、不十分な学習問題と、WSODモデルによって生成されたFSDと擬似基底真理との厳密な依存である。
本稿では, 単純かつ効果的な手法である擬似基底真理改善ネットワーク(PGTRNet)を提案する。
論文 参考訳(メタデータ) (2021-08-25T19:20:49Z) - Learning a Proposal Classifier for Multiple Object Tracking [36.67900094433032]
提案生成,提案スコア,軌道推論のパラダイムをアフィニティグラフ上でモデル化する,新しい提案ベースの学習可能なフレームワークを提案する。
提案手法は,従来の2つの公開ベンチマークにおいて,MOTAとIDF1の両性能改善を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-14T10:46:54Z) - Point-Level Temporal Action Localization: Bridging Fully-supervised
Proposals to Weakly-supervised Losses [84.2964408497058]
point-level temporal action localization (ptal) は、各アクションインスタンスに対して1つのタイムスタンプアノテーションで、未トリミングビデオ内のアクションをローカライズすることを目的としている。
既存の手法ではフレームレベルの予測パラダイムを採用し、スパース単一フレームラベルから学習する。
本稿では,ポイントレベルアノテーションの提案に基づく予測パラダイムを検討する。
論文 参考訳(メタデータ) (2020-12-15T12:11:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。