論文の概要: Sketches image analysis: Web image search engine usingLSH index and DNN
InceptionV3
- arxiv url: http://arxiv.org/abs/2105.01147v1
- Date: Mon, 3 May 2021 20:01:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 12:59:56.363522
- Title: Sketches image analysis: Web image search engine usingLSH index and DNN
InceptionV3
- Title(参考訳): sketches image analysis: lsh index と dnn inceptionv3 を用いた web 画像検索エンジン
- Authors: Alessio Schiavo, Filippo Minutella, Mattia Daole, Marsha Gomez Gomez
- Abstract要約: ディープ機能で高速な類似度検索を可能にするために、Locality Sensitive Hashing(LSH) Index上にWebイメージ検索エンジンを実装します。
画像からの深い特徴抽出に転送学習を利用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The adoption of an appropriate approximate similarity search method is an
essential prereq-uisite for developing a fast and efficient CBIR system,
especially when dealing with large amount ofdata. In this study we implement a
web image search engine on top of a Locality Sensitive Hashing(LSH) Index to
allow fast similarity search on deep features. Specifically, we exploit
transfer learningfor deep features extraction from images. Firstly, we adopt
InceptionV3 pretrained on ImageNet asfeatures extractor, secondly, we try out
several CNNs built on top of InceptionV3 as convolutionalbase fine-tuned on our
dataset. In both of the previous cases we index the features extracted within
ourLSH index implementation so as to compare the retrieval performances with
and without fine-tuning.In our approach we try out two different LSH
implementations: the first one working with real numberfeature vectors and the
second one with the binary transposed version of those vectors.
Interestingly,we obtain the best performances when using the binary LSH,
reaching almost the same result, in termsof mean average precision, obtained by
performing sequential scan of the features, thus avoiding thebias introduced by
the LSH index. Lastly, we carry out a performance analysis class by class in
terms ofrecall againstmAPhighlighting, as expected, a strong positive
correlation between the two.
- Abstract(参考訳): 適切な近似類似性探索法を採用することは、特に大量のデータを扱う際に、高速で効率的なCBIRシステムの開発に必須の前提条件である。
本研究では,LSH(Locality Sensitive Hashing)インデックス上にWeb画像検索エンジンを実装し,より深い特徴を高速に類似性検索できるようにする。
具体的には,画像からの深い特徴抽出に転送学習を利用する。
まず、ImageNet Asfeatures extractorで事前トレーニングされたInceptionV3を採用し、次に、InceptionV3上に構築されたCNNを、データセットで微調整された畳み込みベースとして試しました。
前回の2つのケースでは,検索性能を微調整せずに比較するために,ourlsh インデックス実装で抽出された特徴をインデックス化する。このアプローチでは,2つの異なる lsh 実装を試す。
興味深いことに, 2進LSHを用いた場合, 平均平均精度でほぼ同じ値に達すると, 特徴の逐次スキャンを行い, LSH指数によるバイアスを回避することができる。
最後に,クラス毎のパフォーマンス分析クラスを,期待通り,両クラス間に強い正の相関関係を示すrecall対maphighlightingを用いて実施する。
関連論文リスト
- Operational Advice for Dense and Sparse Retrievers: HNSW, Flat, or Inverted Indexes? [62.57689536630933]
本稿では,オープンソースのLucene検索ライブラリを用いたBEIRデータセットの実験結果について述べる。
本研究は,高密度かつ疎密なレトリバーの設計空間を理解するための,今日の検索実践者へのガイダンスを提供する。
論文 参考訳(メタデータ) (2024-09-10T12:46:23Z) - Semi-Parametric Retrieval via Binary Token Index [71.78109794895065]
Semi-parametric Vocabulary Disentangled Retrieval (SVDR) は、新しい半パラメトリック検索フレームワークである。
既存のニューラル検索手法に似た、高い有効性のための埋め込みベースのインデックスと、従来の用語ベースの検索に似た、迅速かつ費用対効果の高いセットアップを可能にするバイナリトークンインデックスの2つのタイプをサポートする。
埋め込みベースインデックスを使用する場合の高密度検索器DPRよりも3%高いトップ1検索精度と、バイナリトークンインデックスを使用する場合のBM25よりも9%高いトップ1検索精度を実現する。
論文 参考訳(メタデータ) (2024-05-03T08:34:13Z) - Efficient Match Pair Retrieval for Large-scale UAV Images via Graph
Indexed Global Descriptor [9.402103660431791]
本稿では,効率的なマッチングペア検索手法を提案し,並列SfM再構成のための統合ワークフローを実装した。
提案手法は3つの大規模データセットを用いて検証されている。
論文 参考訳(メタデータ) (2023-07-10T12:41:55Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - RangeViT: Towards Vision Transformers for 3D Semantic Segmentation in
Autonomous Driving [80.14669385741202]
視覚変換器(ViT)は多くの画像ベースのベンチマークで最先端の結果を得た。
ViTはトレーニングが難しいことで知られており、強力な表現を学ぶために大量のトレーニングデータを必要とする。
提案手法はRangeViTと呼ばれ,nuScenes や Semantic KITTI において既存のプロジェクションベースの手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-24T18:50:48Z) - Reuse your features: unifying retrieval and feature-metric alignment [3.845387441054033]
DRANは視覚的ローカライゼーションの3段階の機能を生成できる最初のネットワークである。
公開ベンチマークの挑戦的な条件下では、堅牢性と正確性の観点から競争性能を達成する。
論文 参考訳(メタデータ) (2022-04-13T10:42:00Z) - Web image search engine based on LSH index and CNN Resnet50 [0.0]
そこで我々は、CBIRシステムを実装するためにLocality Sensitive Hashing(LSH)インデックスを採用した。
具体的には、画像から深い特徴を抽出するために転送学習技術を利用する。
次に、前述の2つのCNNの上に構築された、完全に接続されたディープニューラルネットワークを試す。
論文 参考訳(メタデータ) (2021-08-20T14:43:41Z) - DenserNet: Weakly Supervised Visual Localization Using Multi-scale
Feature Aggregation [7.2531609092488445]
画像表現の異なる意味レベルで特徴マップを集約する畳み込みニューラルネットワークアーキテクチャを開発する。
第二に、我々のモデルは、正および負のGPSタグ付き画像対以外の画素レベルのアノテーションなしで、エンドツーエンドで訓練されている。
第3に、アーキテクチャが計算中に特徴やパラメータを共有しているため、計算効率がよい。
論文 参考訳(メタデータ) (2020-12-04T02:16:47Z) - Learning to hash with semantic similarity metrics and empirical KL
divergence [3.04585143845864]
ハッシュの学習は、大規模データベースからの近接探索を正確に、そして近似的に行うための効率的なパラダイムである。
バイナリハッシュコードは典型的には、CNNから出力特徴を丸め、イメージから抽出される。
i) 学習特徴の相対的なハッシュコード距離を目標値と一致するように促進する新規な損失関数により, (i) を克服する。
我々は、ネットワーク出力とバイナリターゲット分布のKL分散の微分可能な推定を通じて、(ii)に対処し、その結果、特徴がバイナリに丸められたときの情報損失を最小限に抑える。
論文 参考訳(メタデータ) (2020-05-11T08:20:26Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z) - Learning to Hash with Graph Neural Networks for Recommender Systems [103.82479899868191]
グラフ表現学習は、大規模に高品質な候補探索をサポートすることに多くの注目を集めている。
ユーザ・イテム相互作用ネットワークにおけるオブジェクトの埋め込みベクトルの学習の有効性にもかかわらず、連続的な埋め込み空間におけるユーザの好みを推測する計算コストは膨大である。
連続的かつ離散的なコードとを協調的に学習するための,単純かつ効果的な離散表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-04T06:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。