論文の概要: Online Active Proposal Set Generation for Weakly Supervised Object
Detection
- arxiv url: http://arxiv.org/abs/2101.07929v1
- Date: Wed, 20 Jan 2021 02:20:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 01:26:18.447066
- Title: Online Active Proposal Set Generation for Weakly Supervised Object
Detection
- Title(参考訳): 弱教師付き物体検出のためのオンラインアクティブ提案セット生成
- Authors: Ruibing Jin, Guosheng Lin, and Changyun Wen
- Abstract要約: 弱い教師付きオブジェクト検出メソッドはイメージレベルのアノテーションのみを必要とする。
オンライン提案サンプリングはこれらの問題に対する直感的な解決策である。
提案アルゴリズムは, PASCAL VOC 2007 と 2012 の両データセットに対して一貫した, 有意な改善を示した。
- 参考スコア(独自算出の注目度): 41.385545249520696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To reduce the manpower consumption on box-level annotations, many weakly
supervised object detection methods which only require image-level annotations,
have been proposed recently. The training process in these methods is
formulated into two steps. They firstly train a neural network under weak
supervision to generate pseudo ground truths (PGTs). Then, these PGTs are used
to train another network under full supervision. Compared with fully supervised
methods, the training process in weakly supervised methods becomes more complex
and time-consuming. Furthermore, overwhelming negative proposals are involved
at the first step. This is neglected by most methods, which makes the training
network biased towards to negative proposals and thus degrades the quality of
the PGTs, limiting the training network performance at the second step. Online
proposal sampling is an intuitive solution to these issues. However, lacking of
adequate labeling, a simple online proposal sampling may make the training
network stuck into local minima. To solve this problem, we propose an Online
Active Proposal Set Generation (OPG) algorithm. Our OPG algorithm consists of
two parts: Dynamic Proposal Constraint (DPC) and Proposal Partition (PP). DPC
is proposed to dynamically determine different proposal sampling strategy
according to the current training state. PP is used to score each proposal,
part proposals into different sets and generate an active proposal set for the
network optimization. Through experiments, our proposed OPG shows consistent
and significant improvement on both datasets PASCAL VOC 2007 and 2012, yielding
comparable performance to the state-of-the-art results.
- Abstract(参考訳): ボックスレベルのアノテーションの消費電力を減らすため,画像レベルのアノテーションのみを必要とする弱教師付きオブジェクト検出法が近年提案されている。
これらの方法のトレーニングプロセスを2つのステップに定式化する。
まず、弱い監督下でニューラルネットワークをトレーニングし、擬似基底真理(PGT)を生成する。
そして、これらのPGTは、完全な監視下で別のネットワークをトレーニングするために使用される。
完全教師付き手法と比較して、弱教師付き手法の訓練プロセスはより複雑で時間がかかる。
さらに、最初の段階では圧倒的な否定的な提案が絡み合っている。
これはほとんどの手法で無視されており、トレーニングネットワークは負の提案に偏り、PGTの品質が低下し、トレーニングネットワークの性能が2番目のステップで制限される。
オンライン提案サンプリングはこれらの問題に対する直感的な解決策である。
しかし、適切なラベル付けがないため、簡単なオンライン提案サンプリングにより、トレーニングネットワークをローカルなミニマに固定することができる。
そこで本研究では,オンラインアクティブ・プロポーザル・セット生成(OPG)アルゴリズムを提案する。
提案アルゴリズムは動的提案制約 (DPC) と提案分割 (PP) の2つの部分から構成される。
DPCは、現在のトレーニング状況に応じて異なる提案サンプリング戦略を動的に決定する。
PPは各提案をスコアリングし、提案を異なるセットに分割し、ネットワーク最適化のためのアクティブな提案セットを生成する。
実験により,提案したOPGは, PASCAL VOC 2007 と 2012 の両データセットに対して一貫した, 有意な改善を示した。
関連論文リスト
- HUWSOD: Holistic Self-training for Unified Weakly Supervised Object Detection [66.42229859018775]
我々は,HUWSOD(HuWSOD)と呼ばれる,統一・高容量弱教師付きオブジェクト検出(WSOD)ネットワークを導入する。
HUWSODには、自己管理された提案生成器と、従来のオブジェクト提案を置き換えるために、マルチレートで再構成されたピラミッドを備えたオートエンコーダ提案生成器が組み込まれている。
提案手法は,よく設計されたオフラインオブジェクト提案と大きく異なるが,WSOD訓練には有効であることを示す。
論文 参考訳(メタデータ) (2024-06-27T17:59:49Z) - Proposal-Based Multiple Instance Learning for Weakly-Supervised Temporal
Action Localization [98.66318678030491]
微弱に監督された時間的行動ローカライゼーションは、トレーニング中にビデオレベルのカテゴリラベルのみを持つ未トリミングビデオのアクションをローカライズし、認識することを目的としている。
本稿では,提案手法をベースとしたP-MIL(Multiple Instance Learning)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-29T02:48:04Z) - Transformer-based assignment decision network for multiple object
tracking [0.0]
本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。
提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-08-06T19:47:32Z) - W2N:Switching From Weak Supervision to Noisy Supervision for Object
Detection [64.10643170523414]
弱い監督からうるさい監督(W2N)に切り替える新しいパラダイムを持つ新しいWSODフレームワークを提案する。
ローカライズ適応モジュールでは、元の擬似接地構造における識別部分の割合を減らすために正規化損失を提案する。
我々のW2Nは、既存の純粋なWSODメソッドや転送学習メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-07-25T12:13:48Z) - Contrastive Proposal Extension with LSTM Network for Weakly Supervised
Object Detection [52.86681130880647]
画像レベルのラベルしか使用せず、膨大なアノテーションコストを節約できるため、WSOD (Weakly supervised Object Detection) が注目されている。
本稿では,初期提案と拡張提案を比較して,初期提案を最適化する手法を提案する。
PASCAL VOC 2007 と VOC 2012 と MS-COCO のデータセットを用いた実験により,本手法は最先端の結果を得た。
論文 参考訳(メタデータ) (2021-10-14T16:31:57Z) - Natural Language Video Localization with Learnable Moment Proposals [40.91060659795612]
学習可能なモーメントの提案を固定したLPNet(Learnable Proposal Network for NLVL)と呼ばれる新しいモデルを提案する。
本稿では,既存の最先端手法に対するLPNetの有効性を示す。
論文 参考訳(メタデータ) (2021-09-22T12:18:58Z) - PGTRNet: Two-phase Weakly Supervised Object Detection with Pseudo Ground
Truth Refining [10.262660606897974]
画像レベルのアノテーションだけで検知器を訓練することを目的とした弱い監視対象検出(WSOD)が注目されている。
現在の最先端のアプローチは、主に2段階のトレーニング戦略に従い、完全な教師付き検出器(FSD)と純粋なWSODモデルを統合する。
2相WSODアプローチの性能を阻害する主な問題は2つある。すなわち、不十分な学習問題と、WSODモデルによって生成されたFSDと擬似基底真理との厳密な依存である。
本稿では, 単純かつ効果的な手法である擬似基底真理改善ネットワーク(PGTRNet)を提案する。
論文 参考訳(メタデータ) (2021-08-25T19:20:49Z) - Learning a Proposal Classifier for Multiple Object Tracking [36.67900094433032]
提案生成,提案スコア,軌道推論のパラダイムをアフィニティグラフ上でモデル化する,新しい提案ベースの学習可能なフレームワークを提案する。
提案手法は,従来の2つの公開ベンチマークにおいて,MOTAとIDF1の両性能改善を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-14T10:46:54Z) - Subset Sampling For Progressive Neural Network Learning [106.12874293597754]
プログレッシブニューラルネットワーク学習は、ネットワークのトポロジを漸進的に構築し、トレーニングデータに基づいてパラメータを最適化するアルゴリズムのクラスである。
段階的なトレーニングステップ毎にトレーニングデータのサブセットを活用することで,このプロセスの高速化を提案する。
オブジェクト,シーン,顔の認識における実験結果から,提案手法が最適化手順を大幅に高速化することを示す。
論文 参考訳(メタデータ) (2020-02-17T18:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。