論文の概要: Hierarchical Few-Shot Object Detection: Problem, Benchmark and Method
- arxiv url: http://arxiv.org/abs/2210.03940v1
- Date: Sat, 8 Oct 2022 07:02:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 17:10:07.355315
- Title: Hierarchical Few-Shot Object Detection: Problem, Benchmark and Method
- Title(参考訳): 階層的少数ショット物体検出:問題、ベンチマーク及び方法
- Authors: Lu Zhang, Yang Wang, Jiaogen Zhou, Chenbo Zhang, Yinglu Zhang, Jihong
Guan, Yatao Bian, Shuigeng Zhou
- Abstract要約: 階層型小ショットオブジェクト検出(Hi-FSOD)と呼ばれる新しい問題を提案・解決する。
Hi-FSODは、FSODパラダイムの階層的なカテゴリを持つオブジェクトを検出することを目的としている。
大規模かつ高品質なHi-FSODベンチマークデータセットHiFSOD-Birdを構築した。
- 参考スコア(独自算出の注目度): 29.810528396323303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) is to detect objects with a few examples.
However, existing FSOD methods do not consider hierarchical fine-grained
category structures of objects that exist widely in real life. For example,
animals are taxonomically classified into orders, families, genera and species
etc. In this paper, we propose and solve a new problem called hierarchical
few-shot object detection (Hi-FSOD), which aims to detect objects with
hierarchical categories in the FSOD paradigm. To this end, on the one hand, we
build the first large-scale and high-quality Hi-FSOD benchmark dataset
HiFSOD-Bird, which contains 176,350 wild-bird images falling to 1,432
categories. All the categories are organized into a 4-level taxonomy,
consisting of 32 orders, 132 families, 572 genera and 1,432 species. On the
other hand, we propose the first Hi-FSOD method HiCLPL, where a hierarchical
contrastive learning approach is developed to constrain the feature space so
that the feature distribution of objects is consistent with the hierarchical
taxonomy and the model's generalization power is strengthened. Meanwhile, a
probabilistic loss is designed to enable the child nodes to correct the
classification errors of their parent nodes in the taxonomy. Extensive
experiments on the benchmark dataset HiFSOD-Bird show that our method HiCLPL
outperforms the existing FSOD methods.
- Abstract(参考訳): FSOD(Few-shot Object Detection)は、オブジェクトをいくつかの例で検出する。
しかし、既存のFSOD法は実生活において広く存在する対象の階層的細粒度圏構造を考慮していない。
例えば、動物は分類学的に秩序、家族、属、種等に分類される。
本稿では,階層的少数ショットオブジェクト検出(Hi-FSOD)という,FSODパラダイムの階層的カテゴリを持つオブジェクトの検出を目的とした,新たな課題を提案する。
この目的のために、私たちは176,350のワイルドバード画像を含む、最初の大規模で高品質なhi-fsodベンチマークデータセットhifsod-birdを構築しました。
全ての分類は4段階の分類で、32の順序、132の家系、572の属、1,432の種からなる。
一方,階層的コントラスト学習手法であるHi-FSOD法では,オブジェクトの特徴分布が階層的分類と一致し,モデルの一般化力が強化されるように特徴空間を制約する手法が提案されている。
一方、確率的損失は、子ノードが分類学における親ノードの分類誤差を補正できるように設計されている。
ベンチマークデータセットHiFSOD-Birdの大規模な実験により、我々の手法HiCLPLが既存のFSOD法より優れていることが示された。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - SMILe: Leveraging Submodular Mutual Information For Robust Few-Shot Object Detection [2.0755366440393743]
Few-Shot Object Detection (FSOD) において、オブジェクトクラスの融合と忘れは重要な課題である。
本稿では,相互情報機能を導入した新しいサブモジュール型相互情報学習フレームワークを提案する。
提案手法は,バックボーンアーキテクチャに依存しないFSODの既存手法に一般化する。
論文 参考訳(メタデータ) (2024-07-02T20:53:43Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Semantic Guided Level-Category Hybrid Prediction Network for
Hierarchical Image Classification [8.456482280676884]
階層分類(HC)は、各オブジェクトに階層構造にまとめられた複数のラベルを割り当てる。
本稿では,そのレベルとカテゴリの予測をエンドツーエンドで共同で行うことのできる,セマンティックガイド付き階層型ハイブリッド予測ネットワーク(SGLCHPN)を提案する。
論文 参考訳(メタデータ) (2022-11-22T13:49:10Z) - On Hyperbolic Embeddings in 2D Object Detection [76.12912000278322]
双曲幾何学が対象分類空間の基盤構造に適合するかどうかを考察する。
2段階、キーポイントベース、トランスフォーマーベースオブジェクト検出アーキテクチャに双曲型分類器を組み込む。
分類空間の構造に現れる分類階級階層を観察し、分類誤差を低くし、全体的な対象検出性能を高める。
論文 参考訳(メタデータ) (2022-03-15T16:43:40Z) - Decoupling Object Detection from Human-Object Interaction Recognition [37.133695677465376]
DEFRは、物体の位置や人間のポーズを使わずに、画像レベルでのヒューマン・オブジェクト・インタラクション(HOI)を認識できる。
本研究では,検出不要な手法の性能向上のための2つの知見を提案する。
論文 参考訳(メタデータ) (2021-12-13T03:01:49Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage
Object Detectors [64.93963042395976]
暗黙のInstance-Invariant Network(I3Net)は、ワンステージ検出器の適応に適しています。
i3netは、異なる層における深い特徴の自然な特徴を利用してインスタンス不変な特徴を暗黙的に学習する。
実験によると、I3Netはベンチマークデータセットの最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2021-03-25T11:14:36Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。