論文の概要: ALWOD: Active Learning for Weakly-Supervised Object Detection
- arxiv url: http://arxiv.org/abs/2309.07914v1
- Date: Thu, 14 Sep 2023 17:59:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-15 11:44:19.946380
- Title: ALWOD: Active Learning for Weakly-Supervised Object Detection
- Title(参考訳): ALWOD:弱スーパービジョンオブジェクト検出のためのアクティブラーニング
- Authors: Yuting Wang, Velibor Ilic, Jiatong Li, Branislav Kisacanin, and
Vladimir Pavlovic
- Abstract要約: 我々は、弱い、半教師付きオブジェクト検出パラダイムでアクティブな学習を融合させる新しいフレームワークALWODを提案する。
ALWODは、一部のラベル付きだが戦略的に選択された画像インスタンスで訓練されたODと、完全にラベル付けされたデータに依存するODとのギャップを著しく狭めることを示した。
- 参考スコア(独自算出の注目度): 14.063031246614488
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection (OD), a crucial vision task, remains challenged by the lack
of large training datasets with precise object localization labels. In this
work, we propose ALWOD, a new framework that addresses this problem by fusing
active learning (AL) with weakly and semi-supervised object detection
paradigms. Because the performance of AL critically depends on the model
initialization, we propose a new auxiliary image generator strategy that
utilizes an extremely small labeled set, coupled with a large weakly tagged set
of images, as a warm-start for AL. We then propose a new AL acquisition
function, another critical factor in AL success, that leverages the
student-teacher OD pair disagreement and uncertainty to effectively propose the
most informative images to annotate. Finally, to complete the AL loop, we
introduce a new labeling task delegated to human annotators, based on selection
and correction of model-proposed detections, which is both rapid and effective
in labeling the informative images. We demonstrate, across several challenging
benchmarks, that ALWOD significantly narrows the gap between the ODs trained on
few partially labeled but strategically selected image instances and those that
rely on the fully-labeled data. Our code is publicly available on
https://github.com/seqam-lab/ALWOD.
- Abstract(参考訳): オブジェクト検出(OD)は重要なビジョンタスクであり、正確なオブジェクトローカライゼーションラベルを持つ大規模なトレーニングデータセットが不足しているため、依然として課題である。
本研究では,弱教師付きオブジェクト検出パラダイムを用いたアクティブラーニング(al)を用いて,この問題に対処する新しいフレームワークであるalwodを提案する。
ALの性能はモデル初期化に大きく依存するため、非常に小さなラベル付きセットと大きなタグ付けされた画像のセットを併用した補助画像生成戦略をALのウォームスタートとして提案する。
次に,学生と教師のODペア間の不一致と不確実性を活用して,アノテートする最も情報性の高いイメージを効果的に提案するAL獲得関数を提案する。
最後に、ALループを完了するために、人間のアノテーションに委譲された新しいラベル付けタスクを導入し、情報的画像のラベル付けを迅速かつ効果的に行うモデル提案検出の選定と修正を行った。
いくつかの難解なベンチマークを通じて、alwodは、一部のラベル付きだが戦略的に選択された画像インスタンスでトレーニングされたodと、完全にラベル付きデータに依存するodとのギャップを大幅に狭めることを実証した。
私たちのコードはhttps://github.com/seqam-lab/alwodで公開されています。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - Boosting Semi-Supervised Object Detection in Remote Sensing Images With
Active Teaching [34.26972464240673]
リモートセンシング画像における物体検出を促進するために,新しい能動学習法(AL)を提案する。
提案手法では,RoI 比較モジュール (RoICM) を組み込んで,関心領域に対する高信頼な擬似ラベルを生成する。
提案手法は,RSIにおけるオブジェクト検出の最先端手法より優れている。
論文 参考訳(メタデータ) (2024-02-29T08:52:38Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Identification of Novel Classes for Improving Few-Shot Object Detection [12.013345715187285]
Few-shot Object Detection (FSOD) メソッドは、クラス毎に少数のトレーニングサンプルのみを使用して、堅牢なオブジェクト検出を実現することで、改善を提供する。
我々は、FSOD性能を向上させるためのトレーニング中に、未ラベルの新規物体を正のサンプルとして検出し、利用するための半教師付きアルゴリズムを開発した。
実験の結果,本手法は既存のSOTA FSOD法よりも有効であり,優れた結果が得られた。
論文 参考訳(メタデータ) (2023-03-18T14:12:52Z) - DETA: Denoised Task Adaptation for Few-Shot Learning [135.96805271128645]
数ショット学習におけるテスト時間タスク適応は、訓練済みのタスク非依存モデルに適応してタスク固有の知識を取得することを目的としている。
少数のサンプルしか得られないため、支持試料からのイメージノイズ(Xノイズ)またはラベルノイズ(Yノイズ)の悪影響を著しく増幅することができる。
Denoized Task Adaptation (DETA) は、既存のタスク適応アプローチに対して、最初に統合された画像とラベルをデノベートするフレームワークである。
論文 参考訳(メタデータ) (2023-03-11T05:23:20Z) - MUS-CDB: Mixed Uncertainty Sampling with Class Distribution Balancing
for Active Annotation in Aerial Object Detection [40.94800050576902]
最近の空中物体検出モデルは大量のラベル付きトレーニングデータに依存している。
アクティブラーニングは、情報および代表的未ラベルサンプルを選択的にクエリすることで、データラベリングコストを効果的に削減する。
本稿では,費用対効果の高い空中物体検出のための新しい能動学習手法を提案する。
論文 参考訳(メタデータ) (2022-12-06T07:50:00Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。