論文の概要: Online Data Curation for Object Detection via Marginal Contributions to Dataset-level Average Precision
- arxiv url: http://arxiv.org/abs/2511.14197v1
- Date: Tue, 18 Nov 2025 07:08:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.982505
- Title: Online Data Curation for Object Detection via Marginal Contributions to Dataset-level Average Precision
- Title(参考訳): パラメータによるオブジェクト検出のためのオンラインデータキュレーションとデータセットレベルの平均精度
- Authors: Zitang Sun, Masakazu Yoshimura, Junji Otsuka, Atsushi Irie, Takeshi Ohashi,
- Abstract要約: DetGainは、オブジェクト検出に特化したオンラインデータキュレーション手法である。
予測品質に基づいて、各画像の限界摂動をデータセットレベルの平均精度(AP)に推定する。
- 参考スコア(独自算出の注目度): 9.096185004908692
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: High-quality data has become a primary driver of progress under scale laws, with curated datasets often outperforming much larger unfiltered ones at lower cost. Online data curation extends this idea by dynamically selecting training samples based on the model's evolving state. While effective in classification and multimodal learning, existing online sampling strategies rarely extend to object detection because of its structural complexity and domain gaps. We introduce DetGain, an online data curation method specifically for object detection that estimates the marginal perturbation of each image to dataset-level Average Precision (AP) based on its prediction quality. By modeling global score distributions, DetGain efficiently estimates the global AP change and computes teacher-student contribution gaps to select informative samples at each iteration. The method is architecture-agnostic and minimally intrusive, enabling straightforward integration into diverse object detection architectures. Experiments on the COCO dataset with multiple representative detectors show consistent improvements in accuracy. DetGain also demonstrates strong robustness under low-quality data and can be effectively combined with knowledge distillation techniques to further enhance performance, highlighting its potential as a general and complementary strategy for data-efficient object detection.
- Abstract(参考訳): 高品質なデータは、スケール法の下での進歩の原動力となり、キュレートされたデータセットは、より大規模な未フィルタリングデータを低コストで上回ることがしばしばある。
オンラインデータキュレーションは、モデルの進化状態に基づいてトレーニングサンプルを動的に選択することで、このアイデアを拡張します。
分類とマルチモーダル学習には有効であるが、既存のオンラインサンプリング戦略は、その構造的複雑さとドメインギャップのために、オブジェクト検出にまで拡張されることは滅多にない。
DetGainは、オブジェクト検出に特化したオンラインデータキュレーション手法で、各画像の限界摂動を予測品質に基づいてデータセットレベルの平均精度(AP)に推定する。
グローバルスコア分布をモデル化することにより、DetGainはグローバルAP変化を効率的に推定し、教師と学生のコントリビューションギャップを計算し、各イテレーションで情報的サンプルを選択する。
この方法はアーキテクチャに依存しない最小限の侵入性を持ち、多様なオブジェクト検出アーキテクチャに簡単に統合できる。
複数の代表検出器を用いたCOCOデータセットの実験では、精度が一貫した改善が見られた。
DetGainはまた、低品質データの下で強い堅牢性を示し、知識蒸留技術と効果的に組み合わせてパフォーマンスをさらに向上させ、データ効率のオブジェクト検出の汎用的で補完的な戦略としての可能性を強調している。
関連論文リスト
- Towards Open-world Generalized Deepfake Detection: General Feature Extraction via Unsupervised Domain Adaptation [15.737902253508235]
ソーシャルプラットフォームには大量のラベルのない合成データと本物のデータが溢れている。
オープンワールドのシナリオでは、ラベルなしデータの量はラベル付きデータよりもはるかに多い。
我々は,既存の手法の一般化能力を向上させるために,新しいオープンワールドディープフェイク検出一般化訓練戦略(OWG-DS)を提案する。
論文 参考訳(メタデータ) (2025-05-18T10:12:12Z) - Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Leveraging Semi-Supervised Learning to Enhance Data Mining for Image Classification under Limited Labeled Data [35.431340001608476]
従来のデータマイニング手法は、大規模で高次元で複雑なデータに直面すると不十分である。
本研究では,ラベルのないデータを利用するアルゴリズムの能力向上を目的とした,半教師付き学習手法を提案する。
具体的には、自己学習法を採用し、画像の特徴抽出と分類のための畳み込みニューラルネットワーク(CNN)と組み合わせる。
論文 参考訳(メタデータ) (2024-11-27T18:59:50Z) - A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.46695086779598]
実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T03:00:58Z) - Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。