論文の概要: Instance-aware, Context-focused, and Memory-efficient Weakly Supervised
Object Detection
- arxiv url: http://arxiv.org/abs/2004.04725v3
- Date: Wed, 21 Oct 2020 07:32:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 02:47:53.180226
- Title: Instance-aware, Context-focused, and Memory-efficient Weakly Supervised
Object Detection
- Title(参考訳): インスタンス認識,コンテキスト重視,メモリ効率向上によるオブジェクト検出
- Authors: Zhongzheng Ren, Zhiding Yu, Xiaodong Yang, Ming-Yu Liu, Yong Jae Lee,
Alexander G. Schwing, Jan Kautz
- Abstract要約: 我々は、弱教師付き学習のためのインスタンス認識とコンテキスト重視の統合フレームワークを開発する。
メモリ効率の高いシーケンシャルバッチバックプロパゲーションを考案しながら、インスタンス対応の自己学習アルゴリズムと学習可能なコンクリートドロップブロックを採用している。
提案手法はCOCO(12.1% AP$、24.8% AP_50$)、VOC 2007(54.9% AP$)、VOC 2012(52.1% AP$)の最先端結果である。
- 参考スコア(独自算出の注目度): 184.563345153682
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised learning has emerged as a compelling tool for object
detection by reducing the need for strong supervision during training. However,
major challenges remain: (1) differentiation of object instances can be
ambiguous; (2) detectors tend to focus on discriminative parts rather than
entire objects; (3) without ground truth, object proposals have to be redundant
for high recalls, causing significant memory consumption. Addressing these
challenges is difficult, as it often requires to eliminate uncertainties and
trivial solutions. To target these issues we develop an instance-aware and
context-focused unified framework. It employs an instance-aware self-training
algorithm and a learnable Concrete DropBlock while devising a memory-efficient
sequential batch back-propagation. Our proposed method achieves
state-of-the-art results on COCO ($12.1\% ~AP$, $24.8\% ~AP_{50}$), VOC 2007
($54.9\% ~AP$), and VOC 2012 ($52.1\% ~AP$), improving baselines by great
margins. In addition, the proposed method is the first to benchmark ResNet
based models and weakly supervised video object detection. Code, models, and
more details will be made available at: https://github.com/NVlabs/wetectron.
- Abstract(参考訳): 弱い教師付き学習は、訓練中の強力な監督の必要性を減らし、オブジェクト検出の魅力的なツールとして登場した。
1) オブジェクトインスタンスの区別は曖昧である; 2) 検出器はオブジェクト全体ではなく差別的な部分に集中する傾向がある; (3) 基礎的な真実がなければ、オブジェクトの提案は高いリコールのために冗長でなければならない。
これらの課題に対処することは困難であり、しばしば不確実性と自明な解決策を排除する必要がある。
これらの問題をターゲットに、インスタンス認識とコンテキストにフォーカスした統一フレームワークを開発します。
メモリ効率の高いシーケンシャルバッチバックプロパゲーションを考案しながら、インスタンス対応の自己学習アルゴリズムと学習可能なコンクリートドロップブロックを採用している。
提案手法は,COCO(12.1\%~AP$,24.8\%~AP_{50}$),VOC2007(54.9\%~AP$),VOC2012(52.1\%~AP$)の最先端結果を実現し,ベースラインを大幅なマージンで改善する。
さらに,提案手法はResNetベースのモデルと弱教師付きビデオオブジェクト検出をベンチマークする最初の方法である。
コード、モデル、詳細は、https://github.com/nvlabs/wetectron.com/で確認できる。
関連論文リスト
- Few-shot Oriented Object Detection with Memorable Contrastive Learning in Remote Sensing Images [11.217630579076237]
リモートセンシングの分野では、FSOD(Few-shot Object Detection)が注目されている。
本稿では,Few-shot Oriented Object Detection with Memorable Contrastive Learning (FOMC) という,リモートセンシングのための新しいFSOD法を提案する。
具体的には、従来の水平有界ボックスの代わりに指向的有界ボックスを用いて、任意指向の空中オブジェクトのより優れた特徴表現を学習する。
論文 参考訳(メタデータ) (2024-03-20T08:15:18Z) - Towards End-to-End Unsupervised Saliency Detection with Self-Supervised
Top-Down Context [25.85453873366275]
トップダウンコンテキストを介し、自己教師付きエンドツーエンドの有能なオブジェクト検出フレームワークを提案する。
最も深い特徴から自己ローカライゼーションを生かして位置マップを構築し,最も指導的なセグメンテーション指導を学習する。
提案手法は,近年のエンド・ツー・エンド手法と,多段階ソリューションの大部分において,先行的な性能を実現する。
論文 参考訳(メタデータ) (2023-10-14T08:43:22Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - USD: Unknown Sensitive Detector Empowered by Decoupled Objectness and
Segment Anything Model [14.080744645704751]
Open World Object Detection (OWOD) は、新しいコンピュータビジョンタスクである。
本稿では,この2つの境界の学習をデコーダ層に分割する,シンプルで効果的な学習戦略であるDecoupled Objectness Learning(DOL)を提案する。
また、擬似ラベルとソフトウェイト戦略を用いてノイズの負の影響を緩和する補助的スーパービジョンフレームワーク(ASF)も導入する。
論文 参考訳(メタデータ) (2023-06-04T06:42:09Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - FCOS: A simple and strong anchor-free object detector [111.87691210818194]
物体検出を画素ごとの予測方式で解くために, 完全畳み込み型一段物検出器 (FCOS) を提案する。
RetinaNet、SSD、YOLOv3、Faster R-CNNといった最先端のオブジェクト検出器のほとんどは、事前に定義されたアンカーボックスに依存している。
対照的に、提案した検出器FCOSはアンカーボックスフリーであり、提案はフリーである。
論文 参考訳(メタデータ) (2020-06-14T01:03:39Z) - Object Instance Mining for Weakly Supervised Object Detection [24.021995037282394]
本稿では,オブジェクト検出の弱いエンドツーエンドのオブジェクトインスタンスマイニング(OIM)フレームワークを提案する。
OIMは、空間グラフと外観グラフに情報伝搬を導入することにより、各画像に存在する全ての可能なオブジェクトインスタンスを検知しようとする。
反復学習プロセスでは、同一クラスからの識別の少ないオブジェクトインスタンスを徐々に検出し、トレーニングに利用することができる。
論文 参考訳(メタデータ) (2020-02-04T02:11:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。