論文の概要: Practical Insights into Semi-Supervised Object Detection Approaches
- arxiv url: http://arxiv.org/abs/2601.13380v1
- Date: Mon, 19 Jan 2026 20:31:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.052886
- Title: Practical Insights into Semi-Supervised Object Detection Approaches
- Title(参考訳): 半監督対象検出手法の実践的考察
- Authors: Chaoxin Wang, Bharaneeshwar Balasubramaniyam, Anurag Sangem, Nicolais Guevara, Doina Caragea,
- Abstract要約: 半教師付き物体検出(SSOD)は,多数のラベル付き画像と限られたラベル付き画像を活用することにより,検出性能を向上させることを目的としている。
我々は、MixPL、Semi-DETR、Consistent-Teacherの3つの最先端SSODアプローチを比較した。
我々の発見は、精度、モデルサイズ、レイテンシのトレードオフを強調し、どの方法が低データ体制に最も適しているかを洞察する。
- 参考スコア(独自算出の注目度): 2.4538184328842574
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning in data-scarce settings has recently gained significant attention in the research community. Semi-supervised object detection(SSOD) aims to improve detection performance by leveraging a large number of unlabeled images alongside a limited number of labeled images(a.k.a.,few-shot learning). In this paper, we present a comprehensive comparison of three state-of-the-art SSOD approaches, including MixPL, Semi-DETR and Consistent-Teacher, with the goal of understanding how performance varies with the number of labeled images. We conduct experiments using the MS-COCO and Pascal VOC datasets, two popular object detection benchmarks which allow for standardized evaluation. In addition, we evaluate the SSOD approaches on a custom Beetle dataset which enables us to gain insights into their performance on specialized datasets with a smaller number of object categories. Our findings highlight the trade-offs between accuracy, model size, and latency, providing insights into which methods are best suited for low-data regimes.
- Abstract(参考訳): データスカース設定での学習は、最近、研究コミュニティで大きな注目を集めている。
半教師付き物体検出(SSOD)は、限られたラベル付き画像(フェーショット学習)とともに多数のラベル付き画像を活用することにより、検出性能を向上させることを目的としている。
本稿では,MixPL,Semi-DETR,Consistent-Teacherの3つの最先端SSOD手法を総合的に比較し,ラベル付き画像の数によってパフォーマンスがどのように変化するかを理解することを目的とする。
我々は,MS-COCO と Pascal のVOC データセットを用いた実験を行った。
さらに、独自のBeetleデータセット上でSSODアプローチを評価し、オブジェクトカテゴリの少ない特殊なデータセット上で、それらのパフォーマンスに関する洞察を得ることができるようにした。
我々の発見は、精度、モデルサイズ、レイテンシのトレードオフを強調し、どの方法が低データ体制に最も適しているかを洞察する。
関連論文リスト
- Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - Towards Precise Weakly Supervised Object Detection via Interactive
Contrastive Learning of Context Information [10.064363395935478]
弱教師付き物体検出(WSOD)は、画像レベルのタグのみを用いて正確な物体検出を学習することを目的としている。
本稿では、JLWSODと呼ばれる対話型エンドツーエンドWSDOフレームワークを2つの革新と共に提案する。
論文 参考訳(メタデータ) (2023-04-27T11:54:41Z) - Exploring Weakly Supervised Semantic Segmentation Ensembles for Medical
Imaging Systems [11.693197342734152]
画像中の医療条件の信頼性の高い分類と検出のための枠組みを提案する。
我々のフレームワークは、まず低しきい値CAMを用いてターゲットオブジェクトを高い確実性でカバーする。
我々は,BRATSでは最大8%,DECATHLONデータセットでは6%の改善ダイススコアを実証した。
論文 参考訳(メタデータ) (2023-03-14T13:31:05Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。