論文の概要: Utilizing dataset affinity prediction in object detection to assess training data
- arxiv url: http://arxiv.org/abs/2311.09768v2
- Date: Wed, 8 May 2024 07:41:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 19:10:37.515580
- Title: Utilizing dataset affinity prediction in object detection to assess training data
- Title(参考訳): オブジェクト検出におけるデータセット親和性予測の利用によるトレーニングデータの評価
- Authors: Stefan Becker, Jens Bayer, Ronny Hug, Wolfgang Hübner, Michael Arens,
- Abstract要約: 車両データセットのヘテロジニアスプールからサンプルを自動的に選択することで、いわゆるデータセット親和性スコアの利点を示す。
その結果、物体検出器は検出精度を損なうことなく、かなりスペーサーなトレーニングサンプルで訓練できることがわかった。
- 参考スコア(独自算出の注目度): 4.508868068781057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data pooling offers various advantages, such as increasing the sample size, improving generalization, reducing sampling bias, and addressing data sparsity and quality, but it is not straightforward and may even be counterproductive. Assessing the effectiveness of pooling datasets in a principled manner is challenging due to the difficulty in estimating the overall information content of individual datasets. Towards this end, we propose incorporating a data source prediction module into standard object detection pipelines. The module runs with minimal overhead during inference time, providing additional information about the data source assigned to individual detections. We show the benefits of the so-called dataset affinity score by automatically selecting samples from a heterogeneous pool of vehicle datasets. The results show that object detectors can be trained on a significantly sparser set of training samples without losing detection accuracy.
- Abstract(参考訳): データプーリングは、サンプルサイズの増加、一般化の改善、サンプリングバイアスの低減、データのスパーシリティと品質への対処など、さまざまな利点を提供するが、単純ではなく、非生産的かもしれない。
データセットを原則的にプールすることの有効性を評価することは、個々のデータセットの全体的な情報内容を評価するのが困難であるため、難しい。
そこで本研究では,標準オブジェクト検出パイプラインにデータソース予測モジュールを組み込むことを提案する。
モジュールは推論時間に最小限のオーバーヘッドで動作し、個々の検出に割り当てられたデータソースに関する追加情報を提供する。
車両データセットのヘテロジニアスプールからサンプルを自動的に選択することで、いわゆるデータセット親和性スコアの利点を示す。
その結果, 物体検出装置は, 検出精度を損なうことなく, トレーニングサンプルのスペーサーセットでトレーニングできることがわかった。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Dataset Quantization with Active Learning based Adaptive Sampling [11.157462442942775]
また, 不均一なサンプル分布であっても, 性能維持が可能であることを示す。
サンプル選択を最適化するために,新しい能動的学習に基づく適応型サンプリング手法を提案する。
提案手法は,最先端のデータセット圧縮手法よりも優れている。
論文 参考訳(メタデータ) (2024-07-09T23:09:18Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - Distributed sequential federated learning [0.0]
ローカルデータを解析することで,価値ある情報を効率的に効果的に集約するデータ駆動手法を開発した。
我々は、シミュレーションデータの数値的研究と、メキシコの32の病院から収集されたCOVID-19データへの応用を用いている。
論文 参考訳(メタデータ) (2023-01-31T21:20:45Z) - Positive Difference Distribution for Image Outlier Detection using
Normalizing Flows and Contrastive Data [2.9005223064604078]
例えば、標準的なログライクリーフトレーニングによる正規化フローは、外れ値スコアとして不十分である。
本稿では,外乱検出のための非ラベル付き補助データセットと確率的外乱スコアを提案する。
これは、分布内と対照的な特徴密度の間の正規化正の差を学ぶことと等価であることを示す。
論文 参考訳(メタデータ) (2022-08-30T07:00:46Z) - Generating Data to Mitigate Spurious Correlations in Natural Language
Inference Datasets [27.562256973255728]
自然言語処理モデルはしばしば、タスクに依存しない特徴とデータセットのラベルの間の急激な相関を利用して、トレーニング対象のディストリビューション内でのみうまく機能する。
そこで本研究では, 脱バイアス化したデータセットを生成して, 脱バイアス化したオフザシェルフモデルをトレーニングする手法を提案する。
提案手法は,1)高品質なラベル一貫性のあるデータサンプルを生成するためのデータジェネレータの訓練方法,2)素粒子相関に寄与するデータ点を除去するフィルタリング機構から構成される。
論文 参考訳(メタデータ) (2022-03-24T09:08:05Z) - Differential-Critic GAN: Generating What You Want by a Cue of
Preferences [34.25181656518662]
本稿では,ユーザ要求データの分布を学習するためのディファレンシャル・クリティカル・ジェネレーティブ・アドバイザリ・ネットワーク(DiCGAN)を提案する。
DiCGANは、ユーザの期待に応えて望まれるデータを生成し、望まれる特性を持つ生物製品の設計を支援する。
論文 参考訳(メタデータ) (2021-07-14T13:44:07Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - Evaluating representations by the complexity of learning low-loss
predictors [55.94170724668857]
下流タスクの解決に使用されるデータの表現を評価することの問題点を考察する。
本稿では,関心のあるタスクにおける低損失を実現する表現の上に,予測器を学習する複雑性によって表現の質を測定することを提案する。
論文 参考訳(メタデータ) (2020-09-15T22:06:58Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。