論文の概要: Deeply Activated Salient Region for Instance Search
- arxiv url: http://arxiv.org/abs/2002.00185v3
- Date: Mon, 23 Mar 2020 02:57:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 01:05:16.674829
- Title: Deeply Activated Salient Region for Instance Search
- Title(参考訳): インスタンス探索のための深部活性化塩分領域
- Authors: Hui-Chu Xiao, Wan-Lei Zhao, Jie Lin, and Chong-Wah Ngo
- Abstract要約: 本稿では,単純だが効果的なインスタンスレベルの特徴表現について述べる。
クラスに依存しないインスタンスのローカライゼーションと特徴表現の問題について考察する。
実験により、このような特徴表現は既存のほとんどのアプローチよりもかなり優れたパフォーマンスを示します。
- 参考スコア(独自算出の注目度): 31.93185917193055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of instance search depends heavily on the ability to locate
and describe a wide variety of object instances in a video/image collection.
Due to the lack of proper mechanism in locating instances and deriving feature
representation, instance search is generally only effective for retrieving
instances of known object categories. In this paper, a simple but effective
instance-level feature representation is presented. Different from other
approaches, the issues in class-agnostic instance localization and distinctive
feature representation are considered. The former is achieved by detecting
salient instance regions from an image by a layer-wise back-propagation
process. The back-propagation starts from the last convolution layer of a
pre-trained CNN that is originally used for classification. The
back-propagation proceeds layer-by-layer until it reaches the input layer. This
allows the salient instance regions in the input image from both known and
unknown categories to be activated. Each activated salient region covers the
full or more usually a major range of an instance. The distinctive feature
representation is produced by average-pooling on the feature map of certain
layer with the detected instance region. Experiments show that such kind of
feature representation demonstrates considerably better performance over most
of the existing approaches. In addition, we show that the proposed feature
descriptor is also suitable for content-based image search.
- Abstract(参考訳): インスタンス検索のパフォーマンスは、ビデオ/イメージコレクション内のさまざまなオブジェクトインスタンスの特定と記述能力に大きく依存します。
インスタンスの配置と特徴表現の導出に適切なメカニズムがないため、インスタンス検索は一般的に既知のオブジェクトカテゴリのインスタンス検索にのみ有効である。
本稿では,単純だが効果的なインスタンスレベルの特徴表現を提案する。
他のアプローチとは異なり、クラス非依存なインスタンスのローカライゼーションと特徴表現の問題は考慮される。
前者は、層毎のバックプロパゲーションプロセスによって画像から突出したインスタンス領域を検出することで達成される。
バックプロパゲーションは、もともと分類に使用されたトレーニング済みのCNNの最後の畳み込み層から始まる。
バックプロパゲーションは入力層に到達するまで層単位で進行する。
これにより、既知のカテゴリと未知のカテゴリの両方から入力イメージ内のサルエントインスタンスリージョンを起動することができる。
活性化されたそれぞれのサリエント領域は、全領域または通常、インスタンスの主要な範囲をカバーする。
特徴的特徴表現は、検出されたインスタンス領域のある層の特徴マップ上で平均プールすることで生成される。
実験により、このような特徴表現は既存のほとんどのアプローチよりもかなり優れたパフォーマンスを示します。
さらに,提案する特徴記述子は,コンテンツに基づく画像検索にも適していることを示す。
関連論文リスト
- Attribute-Guided Multi-Level Attention Network for Fine-Grained Fashion Retrieval [27.751399400911932]
本稿では,細粒度ファッション検索のための属性誘導型マルチレベルアテンションネットワーク(AG-MAN)を提案する。
具体的には、まず事前訓練された特徴抽出器を拡張し、マルチレベル画像埋め込みをキャプチャする。
そこで本研究では,同じ属性を持つ画像と異なる値を持つ画像とを同一のクラスに分類する分類手法を提案する。
論文 参考訳(メタデータ) (2022-12-27T05:28:38Z) - Baking in the Feature: Accelerating Volumetric Segmentation by Rendering
Feature Maps [42.34064154798376]
既存の大規模データセットで訓練されたモデルから抽出した特徴を用いてセグメント化性能を向上させることを提案する。
この特徴表現をNeRF(Neural Radiance Field)に、特徴マップを体積的にレンダリングし、各入力画像から抽出した特徴を監督することにより、焼成する。
提案手法は,既存手法よりも意味的アノテーションが少なく,多様な場面で高いセグメンテーション精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-09-26T14:52:10Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Topological Semantic Mapping by Consolidation of Deep Visual Features [0.0]
本研究は,ロボットが操作する環境の複数ビューで撮影された2次元画像から,CNNによって抽出された深い視覚的特徴を利用するトポロジカルセマンティックマッピング手法を提案する。
実世界の屋内データセットを用いて実験を行った結果、この手法は領域の視覚的特徴を統合し、それらを用いてオブジェクトとカテゴリを意味的特性として認識できることがわかった。
論文 参考訳(メタデータ) (2021-06-24T01:10:03Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Weakly-Supervised Semantic Segmentation via Sub-category Exploration [73.03956876752868]
我々は、オブジェクトの他の部分に注意を払うために、ネットワークを強制する単純で効果的なアプローチを提案する。
具体的には、画像の特徴をクラスタリングして、アノテーション付き親クラスごとに擬似サブカテゴリラベルを生成する。
提案手法の有効性を検証し,提案手法が最先端手法に対して良好に機能することを示す。
論文 参考訳(メタデータ) (2020-08-03T20:48:31Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - Discriminative Dictionary Design for Action Classification in Still
Images and Videos [29.930239762446217]
本稿では,ロバストな局所特徴とカテゴリ固有の局所特徴を識別する新たな識別手法を提案する。
フレームワークは静止画像とビデオに基づいて、アクション認識データセット上で検証される。
論文 参考訳(メタデータ) (2020-05-20T15:56:41Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。