論文の概要: Scaling Novel Object Detection with Weakly Supervised Detection
Transformers
- arxiv url: http://arxiv.org/abs/2207.05205v3
- Date: Thu, 25 May 2023 19:11:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 00:06:03.354614
- Title: Scaling Novel Object Detection with Weakly Supervised Detection
Transformers
- Title(参考訳): 弱教師付き検出変換器による新しい物体検出のスケーリング
- Authors: Tyler LaBonte, Yale Song, Xin Wang, Vibhav Vineet, Neel Joshi
- Abstract要約: Weakly Supervised Detection Transformerを提案する。これは大規模な事前学習データセットからWSODファインタニングへの効率的な知識伝達を可能にする。
提案手法は, 大規模オブジェクト検出データセットにおいて, 従来の最先端モデルよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 21.219817483091166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A critical object detection task is finetuning an existing model to detect
novel objects, but the standard workflow requires bounding box annotations
which are time-consuming and expensive to collect. Weakly supervised object
detection (WSOD) offers an appealing alternative, where object detectors can be
trained using image-level labels. However, the practical application of current
WSOD models is limited, as they only operate at small data scales and require
multiple rounds of training and refinement. To address this, we propose the
Weakly Supervised Detection Transformer, which enables efficient knowledge
transfer from a large-scale pretraining dataset to WSOD finetuning on hundreds
of novel objects. Additionally, we leverage pretrained knowledge to improve the
multiple instance learning (MIL) framework often used in WSOD methods. Our
experiments show that our approach outperforms previous state-of-the-art models
on large-scale novel object detection datasets, and our scaling study reveals
that class quantity is more important than image quantity for WSOD pretraining.
The code is available at https://github.com/tmlabonte/weakly-supervised-DETR.
- Abstract(参考訳): 重要なオブジェクト検出タスクは、既存のモデルを微調整して、新しいオブジェクトを検出することですが、標準的なワークフローには、収集に要する時間と費用のかかるバウンディングボックスアノテーションが必要です。
weakly supervised object detection (wsod)は、画像レベルのラベルを使ってオブジェクト検出をトレーニングできる魅力的な代替手段を提供する。
しかし、現在のwsodモデルの実用的応用は限定的であり、小規模のデータスケールでのみ動作し、複数のトレーニングと改良を必要とする。
そこで本研究では,大規模事前学習データセットからWSODファインタニングへの効率的な知識伝達を可能にするWeakly Supervised Detection Transformerを提案する。
さらに、事前訓練された知識を活用して、WSODメソッドでよく使われる多重インスタンス学習(MIL)フレームワークを改善します。
実験の結果,提案手法は大規模新規物体検出データセットの先行モデルよりも優れており,wodプリトレーニングでは,クラス量が画像量よりも重要であることが明らかとなった。
コードはhttps://github.com/tmlabonte/weakly-supervised-DETRで公開されている。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - Scale-Invariant Feature Disentanglement via Adversarial Learning for UAV-based Object Detection [18.11107031800982]
本稿では,スケール不変の特徴を学習することで,単段階推論の精度を向上させることを提案する。
3つのベンチマークデータセット上で、最先端の3つの軽量検出フレームワークに適用する。
論文 参考訳(メタデータ) (2024-05-24T11:40:22Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Identification of Novel Classes for Improving Few-Shot Object Detection [12.013345715187285]
Few-shot Object Detection (FSOD) メソッドは、クラス毎に少数のトレーニングサンプルのみを使用して、堅牢なオブジェクト検出を実現することで、改善を提供する。
我々は、FSOD性能を向上させるためのトレーニング中に、未ラベルの新規物体を正のサンプルとして検出し、利用するための半教師付きアルゴリズムを開発した。
実験の結果,本手法は既存のSOTA FSOD法よりも有効であり,優れた結果が得られた。
論文 参考訳(メタデータ) (2023-03-18T14:12:52Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z) - Incremental Few-Shot Object Detection [96.02543873402813]
OpeN-ended Centre nEtは、いくつかの例でクラスオブジェクトの検出を漸進的に学習する検出器である。
ONCEはインクリメンタルな学習パラダイムを十分に尊重しており、新しいクラス登録では、数発のトレーニングサンプルを1回だけフォワードパスするだけでよい。
論文 参考訳(メタデータ) (2020-03-10T12:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。