論文の概要: Object Detection with a Unified Label Space from Multiple Datasets
- arxiv url: http://arxiv.org/abs/2008.06614v1
- Date: Sat, 15 Aug 2020 00:51:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 21:02:29.400081
- Title: Object Detection with a Unified Label Space from Multiple Datasets
- Title(参考訳): 複数データセットからの統一ラベル空間による物体検出
- Authors: Xiangyun Zhao, Samuel Schulter, Gaurav Sharma, Yi-Hsuan Tsai, Manmohan
Chandraker, Ying Wu
- Abstract要約: 異なるラベル空間を持つ複数のデータセットが与えられた場合、この研究の目標は、すべてのラベル空間の結合について予測する単一のオブジェクト検出器をトレーニングすることである。
あるデータセットにアノテートされているが、別のデータセットにアノテートされていない顔のようなオブジェクトカテゴリを考えてみましょう。
顔のようないくつかのカテゴリは、あるデータセットでは前景と見なされるが、別のデータセットでは背景と見なされる。
本稿では,部分的だが正しいアノテーションを補完的だがノイズの多い擬似ラベルと注意深く統合する損失関数を提案する。
- 参考スコア(独自算出の注目度): 94.33205773893151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Given multiple datasets with different label spaces, the goal of this work is
to train a single object detector predicting over the union of all the label
spaces. The practical benefits of such an object detector are obvious and
significant application-relevant categories can be picked and merged form
arbitrary existing datasets. However, naive merging of datasets is not possible
in this case, due to inconsistent object annotations. Consider an object
category like faces that is annotated in one dataset, but is not annotated in
another dataset, although the object itself appears in the latter images. Some
categories, like face here, would thus be considered foreground in one dataset,
but background in another. To address this challenge, we design a framework
which works with such partial annotations, and we exploit a pseudo labeling
approach that we adapt for our specific case. We propose loss functions that
carefully integrate partial but correct annotations with complementary but
noisy pseudo labels. Evaluation in the proposed novel setting requires full
annotation on the test set. We collect the required annotations and define a
new challenging experimental setup for this task based one existing public
datasets. We show improved performances compared to competitive baselines and
appropriate adaptations of existing work.
- Abstract(参考訳): 異なるラベル空間を持つ複数のデータセットが与えられた場合、この研究の目的は、すべてのラベル空間の結合を予測できる単一のオブジェクト検出器をトレーニングすることである。
このようなオブジェクト検出の実用的メリットは明らかであり、アプリケーション関連カテゴリを選択して、任意の既存のデータセットにマージすることができる。
しかし、この場合、一貫性のないオブジェクトアノテーションのため、データセットの単純なマージは不可能である。
あるデータセットにアノテートされているが、別のデータセットにはアノテートされていない顔のようなオブジェクトカテゴリを考えてみましょう。
顔のようないくつかのカテゴリは、あるデータセットでは前景と見なされるが、別のデータセットでは背景となる。
この課題に対処するために、このような部分的なアノテーションを扱うフレームワークを設計し、特定のケースに適応する擬似ラベリングアプローチを活用する。
本稿では,部分的だが正しいアノテーションを補完的だがノイズの多い擬似ラベルと注意深く統合する損失関数を提案する。
提案する新規設定における評価には,テストセットへの完全なアノテーションが必要である。
必要なアノテーションを収集し、既存の1つのパブリックデータセットに基づいて、このタスクの新たな挑戦的な実験的なセットアップを定義します。
競合するベースラインや既存の作業の適切な適応と比較して,パフォーマンスが向上したことを示す。
関連論文リスト
- An Attribute-Enriched Dataset and Auto-Annotated Pipeline for Open Detection [7.531866919805308]
我々は、既存のObjects365データセットの拡張であるObjects365-Attrデータセットを紹介し、属性アノテーションによって区別する。
このデータセットは、色、材料、状態、テクスチャ、トーンを含む幅広い属性のスペクトルを統合することで、オブジェクト検出の不整合を低減する。
5.6Mのオブジェクトレベルの属性記述の広範なコレクションが含まれており、1.4Mのバウンディングボックスに細心の注意を払って注釈付けされている。
論文 参考訳(メタデータ) (2024-09-10T07:53:32Z) - Anno-incomplete Multi-dataset Detection [67.69438032767613]
我々は「不完全なマルチデータセット検出」という新しい問題を提案する。
複数の注釈付きデータセットで全ての対象カテゴリを正確に検出できるエンドツーエンドのマルチタスク学習アーキテクチャを開発した。
論文 参考訳(メタデータ) (2024-08-29T03:58:21Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - AttrSeg: Open-Vocabulary Semantic Segmentation via Attribute
Decomposition-Aggregation [33.25304533086283]
オープンボキャブラリセマンティックセグメンテーションは、推論時に新しいオブジェクトカテゴリをセグメンテーションする必要がある難しいタスクである。
最近の研究では、この課題に対処するために視覚言語による事前訓練が検討されているが、現実的なシナリオでは非現実的な仮定に悩まされている。
本研究は,新しい概念を理解する上で,人間の認知に触発された新しい属性分解集約フレームワークであるAttrSegを提案する。
論文 参考訳(メタデータ) (2023-08-31T19:34:09Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Simple multi-dataset detection [83.9604523643406]
複数の大規模データセット上で統合検出器を訓練する簡単な方法を提案する。
データセット固有のアウトプットを共通の意味分類に自動的に統合する方法を示す。
私たちのアプローチは手動の分類学の調整を必要としません。
論文 参考訳(メタデータ) (2021-02-25T18:55:58Z) - Self-supervised Robust Object Detectors from Partially Labelled Datasets [3.1669406516464007]
データセットをマージすることで、複数のオブジェクトをトレーニングする代わりに、1つの統合オブジェクト検出器をトレーニングすることができます。
本稿では,統合されたデータセットのラベルの欠落を克服するためのトレーニングフレームワークを提案する。
VOC2012 と VOC2007 を用いて,Yolo の誤り率 $approx!48%$ で,シミュレーションした統合データセット上で Yolo をトレーニングするためのフレームワークの評価を行った。
論文 参考訳(メタデータ) (2020-05-23T15:18:20Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。