論文の概要: Class Agnostic Instance-level Descriptor for Visual Instance Search
- arxiv url: http://arxiv.org/abs/2506.16745v1
- Date: Fri, 20 Jun 2025 04:32:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.343959
- Title: Class Agnostic Instance-level Descriptor for Visual Instance Search
- Title(参考訳): ビジュアルインスタンス検索のためのクラス非依存のインスタンスレベル記述子
- Authors: Qi-Ying Sun, Wan-Lei Zhao, Yi-Bo Miao, Chong-Wah Ngo,
- Abstract要約: 教師付きまたは弱教師付きオブジェクト検出手法は、未知のオブジェクトカテゴリの性能が低いため、選択肢には含まれない。
本稿では、自己教師型ViTから出力される特徴集合に基づいて、インスタンスレベルの領域探索を階層的な方法でコンパクトな特徴部分集合の検出としてモデル化する。
私たちのインスタンスレベルの記述子は、既知のオブジェクトカテゴリと未知のオブジェクトカテゴリの両方で有効です。
- 参考スコア(独自算出の注目度): 28.081966026179764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the great success of the deep features in content-based image retrieval, the visual instance search remains challenging due to the lack of effective instance level feature representation. Supervised or weakly supervised object detection methods are not among the options due to their poor performance on the unknown object categories. In this paper, based on the feature set output from self-supervised ViT, the instance level region discovery is modeled as detecting the compact feature subsets in a hierarchical fashion. The hierarchical decomposition results in a hierarchy of feature subsets. The non-leaf nodes and leaf nodes on the hierarchy correspond to the various instance regions in an image of different semantic scales. The hierarchical decomposition well addresses the problem of object embedding and occlusions, which are widely observed in the real scenarios. The features derived from the nodes on the hierarchy make up a comprehensive representation for the latent instances in the image. Our instance-level descriptor remains effective on both the known and unknown object categories. Empirical studies on three instance search benchmarks show that it outperforms state-of-the-art methods considerably.
- Abstract(参考訳): コンテンツベースの画像検索における深い特徴の大きな成功にもかかわらず、効果的なインスタンスレベルの特徴表現が欠如しているため、視覚的なインスタンス検索は依然として困難である。
教師付きあるいは弱教師付きオブジェクト検出手法は、未知のオブジェクトカテゴリの性能が低いため、選択肢には含まれない。
本稿では、自己教師型ViTから出力される特徴集合に基づいて、インスタンスレベルの領域探索を階層的な方法でコンパクトな特徴部分集合の検出としてモデル化する。
階層的な分解は、特徴部分集合の階層化をもたらす。
階層上の非リーフノードとリーフノードは、異なるセマンティックスケールのイメージにおける様々なインスタンス領域に対応する。
階層的な分解は、実際のシナリオで広く見られるオブジェクトの埋め込みと隠蔽の問題によく対処する。
階層上のノードから派生した特徴は、画像内の潜在インスタンスの包括的な表現を構成する。
私たちのインスタンスレベルの記述子は、既知のオブジェクトカテゴリと未知のオブジェクトカテゴリの両方で有効です。
3つのケースサーチベンチマークに関する実証研究は、最先端の手法よりもかなり優れていることを示している。
関連論文リスト
- Learning Visual Hierarchies in Hyperbolic Space for Image Retrieval [28.35250955426006]
ユーザ定義のマルチレベル複雑な視覚階層を,明示的な階層ラベルを必要とせずに,双曲空間にエンコードする学習パラダイムを導入する。
実験により,階層的検索タスクの大幅な改善が示され,視覚的階層を捉える上でのモデルの有効性が示された。
論文 参考訳(メタデータ) (2024-11-26T14:58:06Z) - HEAP: Unsupervised Object Discovery and Localization with Contrastive
Grouping [29.678756772610797]
教師なしオブジェクトの発見と位置決めは、監督なしで画像内のオブジェクトを検出し、セグメント化することを目的としている。
近年の取り組みは、自己監督型トランスフォーマー機能を利用して、有能な前景物体を識別する顕著な可能性を実証している。
これらの問題に対処するために、Herarchical mErging framework via contrAstive grouPing (HEAP) を紹介する。
論文 参考訳(メタデータ) (2023-12-29T06:46:37Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage
Object Detectors [64.93963042395976]
暗黙のInstance-Invariant Network(I3Net)は、ワンステージ検出器の適応に適しています。
i3netは、異なる層における深い特徴の自然な特徴を利用してインスタンス不変な特徴を暗黙的に学習する。
実験によると、I3Netはベンチマークデータセットの最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2021-03-25T11:14:36Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Weakly-supervised Salient Instance Detection [65.0408760733005]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2020-09-29T09:47:23Z) - Weakly-Supervised Semantic Segmentation via Sub-category Exploration [73.03956876752868]
我々は、オブジェクトの他の部分に注意を払うために、ネットワークを強制する単純で効果的なアプローチを提案する。
具体的には、画像の特徴をクラスタリングして、アノテーション付き親クラスごとに擬似サブカテゴリラベルを生成する。
提案手法の有効性を検証し,提案手法が最先端手法に対して良好に機能することを示す。
論文 参考訳(メタデータ) (2020-08-03T20:48:31Z) - Deeply Activated Salient Region for Instance Search [31.93185917193055]
本稿では,単純だが効果的なインスタンスレベルの特徴表現について述べる。
クラスに依存しないインスタンスのローカライゼーションと特徴表現の問題について考察する。
実験により、このような特徴表現は既存のほとんどのアプローチよりもかなり優れたパフォーマンスを示します。
論文 参考訳(メタデータ) (2020-02-01T10:25:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。