論文の概要: Portable Active Learning for Object Detection
- arxiv url: http://arxiv.org/abs/2605.10349v1
- Date: Mon, 11 May 2026 10:52:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.74496
- Title: Portable Active Learning for Object Detection
- Title(参考訳): オブジェクト検出のためのポータブル能動学習
- Authors: Rashi Sharma, Justin Timothy C. Bersamin, Karthikk Subramanian,
- Abstract要約: Portable Active Learning (PAL) は、推論出力のみで動作する検出器に依存しない、ポータブルなフレームワークである。
PALは、クラスレベルのインスタンスの不確実性と画像レベルの多様性を組み合わせて、データ選択をガイドする。
- 参考スコア(独自算出の注目度): 0.649970685896541
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Annotating bounding boxes is costly and limits the scalability of object detection. This challenge is compounded by the need to preserve high accuracy while minimizing manual effort in real-world applications. Prior active learning methods often depend on model features or modify detector internals and training schedules, increasing integration overhead. Moreover, they rarely jointly exploit the benefits of image-level signals, class-imbalance cues, and instance-level uncertainty for comprehensive selection. We present Portable Active Learning (PAL), a detector-agnostic, easily portable framework that operates solely on inference outputs. PAL combines class-wise instance uncertainty with image-level diversity to guide data selection. At each round, PAL trains lightweight class-specific logistic classifiers to distinguish true from false positives, producing entropy-based uncertainty scores for proposals. Candidate images are then refined using global image entropy, class diversity, and image similarity, yielding batches that are both informative and diverse. PAL requires no changes to model internals or training pipelines, ensuring broad compatibility across detectors. Extensive experiments on COCO, PASCAL VOC, and BDD100K demonstrate that PAL consistently improves label efficiency and detection accuracy compared to existing active learning baselines, making it a practical solution for scalable and cost-effective deployment of object detection in real-world settings.
- Abstract(参考訳): 境界ボックスのアノテーションはコストがかかり、オブジェクト検出のスケーラビリティが制限される。
この課題は、現実世界のアプリケーションにおける手作業を最小限にしながら、高い精度を維持する必要性によって複雑化している。
従来のアクティブな学習手法はモデルの特徴に依存したり、ディテクターの内部やトレーニングスケジュールを変更することがあり、統合のオーバーヘッドが増加する。
さらに、画像レベルの信号、クラス不均衡の方法、総合的な選択のためのインスタンスレベルの不確実性の利点を共同で活用することは滅多にない。
提案するPortable Active Learning (PAL, Portable Active Learning) は,推論出力のみで動作する,検出に依存しない,ポータブルなフレームワークである。
PALは、クラスレベルのインスタンスの不確実性と画像レベルの多様性を組み合わせて、データ選択をガイドする。
各ラウンドでPALは、偽陽性と真を区別するために、クラス固有のロジスティック分類器を軽量に訓練し、提案に対するエントロピーベースの不確実性スコアを生成する。
候補画像は、グローバルな画像エントロピー、クラス多様性、および画像類似性を用いて洗練され、情報的かつ多様なバッチが生成される。
PALはモデル内部やトレーニングパイプラインの変更を必要とせず、検出器間の広範な互換性を確保する。
COCO、PASCAL VOC、BDD100Kに関する大規模な実験は、PALが既存のアクティブラーニングベースラインと比較して、ラベル効率と検出精度を一貫して改善していることを示している。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - CamoTeacher: Dual-Rotation Consistency Learning for Semi-Supervised Camouflaged Object Detection [58.07124777351955]
本稿では,Dual-Rotation Consistency Learning(DRCL)を利用した新しい半教師付きCODフレームワークであるCamoTeacherを紹介する。
DRCLは、画素レベルとインスタンスレベルの回転ビューの一貫性を活用することで、擬似ラベルノイズを最小化する。
私たちのコードはまもなく利用可能になります。
論文 参考訳(メタデータ) (2024-08-15T09:33:43Z) - Plug and Play Active Learning for Object Detection [12.50247484568549]
オブジェクト検出のためのPlug and Play Active Learning(PPAL)を導入する。
PPALは不確実性と多様性に基づくサンプリングフェーズを含む2段階の手法である。
我々は,MS-COCOおよびPascal VOCデータセット上で,異なる検出器アーキテクチャを用いてPPALをベンチマークした。
論文 参考訳(メタデータ) (2022-11-21T16:13:23Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object
Detection [66.10057490293981]
半監視対象検出のためのデータ不確実性誘導多相学習法を提案する。
本手法は,ベースライン手法と比較して異常に動作し,大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2021-03-29T09:27:23Z) - Discriminative Nearest Neighbor Few-Shot Intent Detection by
Transferring Natural Language Inference [150.07326223077405]
データ不足を緩和するためには、ほとんどショットラーニングが注目を集めている。
深部自己注意を伴う識別的近傍分類を提示する。
自然言語推論モデル(NLI)を変換することで識別能力を高めることを提案する。
論文 参考訳(メタデータ) (2020-10-25T00:39:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。