論文の概要: DeLR: Active Learning for Detection with Decoupled Localization and
Recognition Query
- arxiv url: http://arxiv.org/abs/2312.16931v1
- Date: Thu, 28 Dec 2023 09:58:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 16:50:38.298754
- Title: DeLR: Active Learning for Detection with Decoupled Localization and
Recognition Query
- Title(参考訳): DeLR:非結合なローカライゼーションと認識クエリによる検出のためのアクティブラーニング
- Authors: Yuhang Zhang, Yuang Deng, Xiaopeng Zhang, Jie Li, Robert C. Qiu, Qi
Tian
- Abstract要約: 本稿では,物体検出のための2つの重要な要素,すなわち局所化と認識を再考する。
そこで本研究では,アクティブクエリの局所化と認識をデカップリングする,効率的なクエリ戦略を提案する。
- 参考スコア(独自算出の注目度): 53.54802901197267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active learning has been demonstrated effective to reduce labeling cost,
while most progress has been designed for image recognition, there still lacks
instance-level active learning for object detection. In this paper, we rethink
two key components, i.e., localization and recognition, for object detection,
and find that the correctness of them are highly related, therefore, it is not
necessary to annotate both boxes and classes if we are given pseudo annotations
provided with the trained model. Motivated by this, we propose an efficient
query strategy, termed as DeLR, that Decoupling the Localization and
Recognition for active query. In this way, we are probably free of class
annotations when the localization is correct, and able to assign the labeling
budget for more informative samples. There are two main differences in DeLR: 1)
Unlike previous methods mostly focus on image-level annotations, where the
queried samples are selected and exhausted annotated. In DeLR, the query is
based on region-level, and we only annotate the object region that is queried;
2) Instead of directly providing both localization and recognition annotations,
we separately query the two components, and thus reduce the recognition budget
with the pseudo class labels provided by the model. Experiments on several
benchmarks demonstrate its superiority. We hope our proposed query strategy
would shed light on researches in active learning in object detection.
- Abstract(参考訳): アクティブラーニングはラベリングコストを削減するために有効であることが証明されているが、ほとんどの進歩は画像認識のために設計されている。
本稿では,物体検出のための局所化と認識という2つの重要な要素を再考し,それらの正しさが極めて関連性があることを見出したので,トレーニングされたモデルに擬似アノテーションが付与された場合,ボックスとクラスの両方に注釈を付ける必要はない。
そこで本研究では,DLRと呼ばれる効率的なクエリ戦略を提案し,ローカル化とアクティブクエリの認識を分離する。
このようにして、ローカライゼーションが正しい場合にはクラスアノテーションが不要になり、より有益なサンプルのためにラベル付け予算を割り当てることができます。
DeLRには2つの大きな違いがある。
1) 従来の手法とは異なり、主に画像レベルのアノテーションに焦点を当てており、クエリされたサンプルが選択され、アノテートされる。
DeLRでは、クエリはリージョンレベルに基づいており、クエリされるオブジェクト領域のみを注釈付けします。
2) ローカライゼーションと認識アノテーションを直接提供する代わりに,2つのコンポーネントを個別にクエリし,モデルが提供する擬似クラスラベルによる認識予算を削減する。
いくつかのベンチマークの実験は、その優位性を示している。
提案するクエリ戦略が,オブジェクト検出におけるアクティブラーニングの研究に光を当ててくれることを願っています。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Few-Shot Object Detection with Sparse Context Transformers [37.106378859592965]
少ないショット検出は、少ないラベル付きデータでトレーニングされたモデルを使用してオブジェクトをローカライズするパターン認識における主要なタスクである。
本稿では,ソース領域におけるオブジェクトの知識を効果的に活用し,対象領域内の少数のトレーニング画像からスパースコンテキストを自動的に学習する新しいスパースコンテキスト変換器を提案する。
提案手法を2つの難易度オブジェクト検出ベンチマークで評価し,提案手法が関連する最先端技術と比較して競合性能を得ることを示す実験結果を得た。
論文 参考訳(メタデータ) (2024-02-14T17:10:01Z) - Deep Active Learning with Noisy Oracle in Object Detection [5.5165579223151795]
ディープオブジェクト検出のためのラベルレビューモジュールを含む複合能動学習フレームワークを提案する。
アクティブなデータセットで部分的にノイズの多いアノテーションを修正するためにアノテーションの予算の一部を利用することで、モデルの性能が早期に向上することを示します。
本実験では,同一のアノテーション予算でラベルレビューを組み込むことで,最大4.5mAPポイントのオブジェクト検出性能の向上を実現した。
論文 参考訳(メタデータ) (2023-09-30T13:28:35Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - Towards Accurate Localization by Instance Search [2.0539994999823334]
自己評価学習フレームワークが提案され、インスタンス検索によって返されるランクリストの精度の高いオブジェクトローカライゼーションを実現する。
提案フレームワークは,クエリと対応するトップランク検索結果から,ターゲットインスタンスを徐々にマイニングする。
インスタンス検索におけるローカライゼーションの実行に加えて、数発のオブジェクト検出の問題は、同じフレームワークの下でも対処される。
論文 参考訳(メタデータ) (2021-07-11T10:03:31Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Cross-Supervised Object Detection [42.783400918552765]
完全ラベル付きベースカテゴリから学習した知識を活用して、新しいカテゴリの弱いラベル付き画像からより良いオブジェクト検出器を構築する方法を示す。
本稿では,インスタンスレベルのアノテーションから学習した検出ヘッドと,画像レベルのアノテーションから学習した認識ヘッドを組み合わせた統合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-26T15:33:48Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z) - Weakly-supervised Object Localization for Few-shot Learning and
Fine-grained Few-shot Learning [0.5156484100374058]
少数のサンプルから新しい視覚カテゴリーを学習することを目的としている。
本稿では,自己認識型補完モジュール(SACモジュール)を提案する。
また,数発の分類のために,識別的深層記述子を選択するためのアクティブマスクも生成する。
論文 参考訳(メタデータ) (2020-03-02T14:07:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。