論文の概要: A Semantic Indexing Structure for Image Retrieval
- arxiv url: http://arxiv.org/abs/2109.06583v1
- Date: Tue, 14 Sep 2021 11:12:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 15:28:01.743927
- Title: A Semantic Indexing Structure for Image Retrieval
- Title(参考訳): 画像検索のための意味インデックス構造
- Authors: Ying Wang, Tingzhen Liu, Zepeng Bu, Yuhui Huang, Lizhong Gao, Qiao
Wang
- Abstract要約: セマンティックインデックス構造(SIS)と呼ばれる新しい分類に基づくインデックス構造を提案する。
SISはクラスタリングセンタではなくセマンティックカテゴリを使用して、データベースパーティションを生成する。
SISは最先端のモデルと比較して優れたパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 9.889773269004241
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In large-scale image retrieval, many indexing methods have been proposed to
narrow down the searching scope of retrieval. The features extracted from
images usually are of high dimensions or unfixed sizes due to the existence of
key points. Most of existing index structures suffer from the dimension curse,
the unfixed feature size and/or the loss of semantic similarity. In this paper
a new classification-based indexing structure, called Semantic Indexing
Structure (SIS), is proposed, in which we utilize the semantic categories
rather than clustering centers to create database partitions, such that the
proposed index SIS can be combined with feature extractors without the
restriction of dimensions. Besides, it is observed that the size of each
semantic partition is positively correlated with the semantic distribution of
database. Along this way, we found that when the partition number is normalized
to five, the proposed algorithm performed very well in all the tests. Compared
with state-of-the-art models, SIS achieves outstanding performance.
- Abstract(参考訳): 大規模画像検索では,検索範囲を狭めるためにインデックス化手法が多数提案されている。
画像から抽出される特徴は通常、キーポイントの存在による高次元または非固定サイズである。
既存のインデックス構造のほとんどは、次元の呪い、未固定の機能サイズ、意味的類似性の喪失に苦しんでいる。
本稿では,データベース分割にクラスタリングセンタではなく意味カテゴリーを活用し,提案するインデックスsisを次元制限なしに特徴抽出器と組み合わせることが可能な,新しい分類ベースのインデックス構造であるセマンティックインデックス構造(sis)を提案する。
さらに,各セマンティックパーティションのサイズがデータベースの意味分布と正の相関関係があることが観察された。
このようにして、分割番号を5に正規化すると、提案アルゴリズムがすべてのテストで非常にうまく機能することを発見した。
最先端のモデルと比較すると、SISは優れたパフォーマンスを実現している。
関連論文リスト
- Accelerating spherical K-means clustering for large-scale sparse document data [0.7366405857677226]
本稿では,大規模かつ高次元のスパース文書データセットを対象とした球面K平均クラスタリングアルゴリズムを提案する。
提案手法は, 大規模文書において, 最先端技術を用いたアルゴリズムと比較して, 高速性能を効果的に達成できることを実験的に実証した。
論文 参考訳(メタデータ) (2024-11-18T05:50:58Z) - Vocabulary-free Image Classification and Semantic Segmentation [71.78089106671581]
本稿では,Vocabulary-free Image Classification (VIC)タスクを導入する。これは,制約のない言語による意味空間から,既知の語彙を必要とせずに,入力画像にクラスを割り当てることを目的としている。
VICは、細かなカテゴリを含む数百万の概念を含む意味空間の広さのために、挑戦的である。
本稿では,事前学習された視覚言語モデルと外部データベースを利用した学習自由度手法CaSEDを提案する。
論文 参考訳(メタデータ) (2024-04-16T19:27:21Z) - Generative Retrieval as Multi-Vector Dense Retrieval [71.75503049199897]
生成検索は、文書の識別子をエンドツーエンドで生成する。
それまでの研究は、原子識別子による生成的検索が単一ベクトル密度検索と等価であることを示した。
生成的検索と多ベクトル高密度検索は,文書の問合せに対する関連性を測定するのと同じ枠組みを共有していることを示す。
論文 参考訳(メタデータ) (2024-03-31T13:29:43Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - Integrating Visual and Semantic Similarity Using Hierarchies for Image
Retrieval [0.46040036610482665]
視覚的階層構造を用いて視覚的および意味的類似性の両方をキャプチャするCBIRの手法を提案する。
階層構造は、分類のために訓練されたディープニューラルネットワークの潜在空間に重複する特徴を持つクラスをマージすることによって構築される。
本手法は,既存の画像検索手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-08-16T15:23:14Z) - Inverted Semantic-Index for Image Retrieval [3.751222656656264]
逆インデックスは、簡潔で正確な候補リストを生成する、より微細なパーティションを構築することを目的としている。
本稿では,コードブック構築時にクラスタリング手法を画像分類に置き換える。
我々は、PQ圧縮による精度損失を軽減するために、セマンティックインデックスと製品量子化(PQ)を組み合わせる。
論文 参考訳(メタデータ) (2022-06-25T11:21:56Z) - A Learned Index for Exact Similarity Search in Metric Spaces [25.330353637669386]
LIMSは、学習したインデックスを構築するために、データクラスタリングとピボットベースのデータ変換技術を使用することが提案されている。
機械学習モデルはディスク上の各データレコードの位置を近似するために開発された。
実世界のデータセットと合成データセットに関する大規模な実験は、従来の指標と比較してLIMSの優位性を示している。
論文 参考訳(メタデータ) (2022-04-21T11:24:55Z) - Generalizing Few-Shot NAS with Gradient Matching [165.5690495295074]
One-Shotメソッドは、1つのスーパーネットをトレーニングし、ウェイトシェアリングを通じて検索空間内の全てのアーキテクチャのパフォーマンスを近似する。
Few-Shot NASは、One-Shotスーパーネットを複数のサブスーパーネットに分割することで、ウェイトシェアリングのレベルを下げる。
Few-Shotよりも優れており、派生したアーキテクチャの精度という点では、従来の同等の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2022-03-29T03:06:16Z) - IHashNet: Iris Hashing Network based on efficient multi-index hashing [9.540646692526348]
インデックス構造と互換性のあるアイリスバーコード(IBC)にバイナライズされた実数値ディープアイリス特徴を用いたアイリスインデックス方式を提案する。
irisデータセットをインデックス化するために、我々はバイナリ機能をマルチインデックスハッシュスキームと互換性のある改良された機能に変換するロスを提案しました。
論文 参考訳(メタデータ) (2020-12-07T17:50:57Z) - The Case for Learned Spatial Indexes [62.88514422115702]
我々は、空間範囲の問合せに答えるために、最先端の学習した多次元インデックス構造(すなわちFlood)から提案した手法を用いる。
i) パーティション内の機械学習検索は、1次元でフィルタリングを使用する場合の2進探索よりも11.79%速く、39.51%高速であることを示す。
また、2次元でフィルタする最も近い競合相手の1.23倍から1.83倍の速さで機械学習インデックスを精査する。
論文 参考訳(メタデータ) (2020-08-24T12:09:55Z) - Compact Deep Aggregation for Set Retrieval [87.52470995031997]
画像の大規模データセットから複数の顔を含む画像を取得することに焦点を当てる。
ここでは、セットは各画像の顔記述子で構成され、複数のIDに対するクエリが与えられた後、すべてのIDを含む画像を取得することが目標である。
このコンパクトディスクリプタは,画像毎に最大2面まで識別性の低下が最小限に抑えられ,その後徐々に劣化することを示す。
論文 参考訳(メタデータ) (2020-03-26T08:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。