論文の概要: Extending Dataset Pruning to Object Detection: A Variance-based Approach
- arxiv url: http://arxiv.org/abs/2505.17245v1
- Date: Thu, 22 May 2025 19:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.673272
- Title: Extending Dataset Pruning to Object Detection: A Variance-based Approach
- Title(参考訳): オブジェクト検出へのデータセットプルーニングの拡張:分散に基づくアプローチ
- Authors: Ryota Yagi,
- Abstract要約: 本稿では,オブジェクト検出領域への分類プルーニング手法の最初の拡張について述べる。
可変ベース予測スコア(VPS)と呼ばれる新しいスコアリング手法を含む、最適化された解を提案する。
私たちのワークブリッジは、データセットのプルーニングとオブジェクト検出、複雑なビジョンタスクにおけるデータセットプルーニングの道を開くものです。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dataset pruning -- selecting a small yet informative subset of training data -- has emerged as a promising strategy for efficient machine learning, offering significant reductions in computational cost and storage compared to alternatives like dataset distillation. While pruning methods have shown strong performance in image classification, their extension to more complex computer vision tasks, particularly object detection, remains relatively underexplored. In this paper, we present the first principled extension of classification pruning techniques to the object detection domain, to the best of our knowledge. We identify and address three key challenges that hinder this transition: the Object-Level Attribution Problem, the Scoring Strategy Problem, and the Image-Level Aggregation Problem. To overcome these, we propose tailored solutions, including a novel scoring method called Variance-based Prediction Score (VPS). VPS leverages both Intersection over Union (IoU) and confidence scores to effectively identify informative training samples specific to detection tasks. Extensive experiments on PASCAL VOC and MS COCO demonstrate that our approach consistently outperforms prior dataset pruning methods in terms of mean Average Precision (mAP). We also show that annotation count and class distribution shift can influence detection performance, but selecting informative examples is a more critical factor than dataset size or balance. Our work bridges dataset pruning and object detection, paving the way for dataset pruning in complex vision tasks.
- Abstract(参考訳): データセットプルーニング(Dataset pruning) — トレーニングデータの小さな情報的サブセットを選択する — は、効率的な機械学習のための有望な戦略として現れ、データセットの蒸留のような代替手段と比較して、計算コストとストレージの大幅な削減を提供する。
プルーニング法は画像分類において高い性能を示しているが、より複雑なコンピュータビジョンタスク(特に物体検出)への拡張は、いまだにあまり研究されていない。
本稿では,オブジェクト検出領域への分類解析手法の第一原理拡張について,その知識を最大限に活用するために提案する。
我々は、この移行を妨げる3つの主要な課題、すなわち、オブジェクトレベル属性問題(Object-Level Attribution Problem)、スコーリング戦略問題(Scoring Strategy Problem)、イメージレベル集約問題(Image-Level Aggregation Problem)を特定し、対処する。
そこで本研究では,変数ベースの予測スコア(VPS)と呼ばれる新しいスコアリング手法を含む,最適化された解を提案する。
VPSは、IoU(Intersection over Union)と信頼スコアの両方を活用して、検出タスク特有の情報的トレーニングサンプルを効果的に識別する。
PASCAL VOCとMS COCOの大規模な実験により、我々の手法は平均精度(mAP)の点で、データセットのプルーニング手法よりも一貫して優れていることが示された。
また、アノテーション数やクラス分布シフトが検出性能に影響を与えることも示していますが、情報的サンプルの選択はデータセットのサイズやバランスよりも重要な要素です。
私たちのワークブリッジは、データセットのプルーニングとオブジェクト検出、複雑なビジョンタスクにおけるデータセットプルーニングの道を開くものです。
関連論文リスト
- Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Semi-Supervised Object Detection: A Survey on Progress from CNN to Transformer [12.042768320132694]
本稿では,物体検出のための半教師付き学習における27の最先端開発について概説する。
データ拡張テクニック、擬似ラベル戦略、一貫性の正則化、敵の訓練方法などをカバーする。
我々は,既存の課題を克服し,物体検出のための半教師あり学習における新たな方向性を探るため,さらなる研究の関心を喚起することを目的としている。
論文 参考訳(メタデータ) (2024-07-11T12:58:13Z) - Aligning Data Selection with Performance: Performance-driven Reinforcement Learning for Active Learning in Object Detection [31.304039641225504]
本稿では,オブジェクト検出のための平均APガイド型アクティブラーニングについて紹介する。
MGRALは、予測されたモデル出力変化の概念を深層検知ネットワークの情報性として活用する新しいアプローチである。
提案手法は,物体検出のための強化学習に基づく能動学習における新たなパラダイムを確立し,高い性能を示す。
論文 参考訳(メタデータ) (2023-10-12T14:59:22Z) - Active Learning for Object Detection with Non-Redundant Informative
Sampling [1.7602289331729377]
我々の戦略は、不確実性と多様性に基づく選択原則を共同選択目標に統合する。
提案したNORISアルゴリズムは,サンプルを用いたトレーニングが他の類似サンプルの情報伝達性に与える影響を定量的に評価する。
PASCAL-VOC と KITTI のランダム選択と比較して,ラベリングコストの 20% と 30% の削減を実現している。
論文 参考訳(メタデータ) (2023-07-17T11:55:20Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - INoD: Injected Noise Discriminator for Self-Supervised Representation
Learning in Agricultural Fields [6.891600948991265]
Injected Noise Discriminator (INoD) を提案する。
INoDは、畳み込みエンコーディング中に2つの非結合データセットからフィーチャーマップをインターリーブし、結果のフィーチャーマップのデータセットアフィリエイトをプレテキストタスクとして予測する。
提案手法により、ネットワークは、あるデータセットで見られるオブジェクトの無意味な表現を学習し、解離したデータセットの類似した特徴と合わせて観察することができる。
論文 参考訳(メタデータ) (2023-03-31T14:46:31Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。