論文の概要: Learning-Based Hashing for ANN Search: Foundations and Early Advances
- arxiv url: http://arxiv.org/abs/2510.04127v1
- Date: Sun, 05 Oct 2025 09:59:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.473231
- Title: Learning-Based Hashing for ANN Search: Foundations and Early Advances
- Title(参考訳): ANN検索のための学習ベースのハッシュ:基礎と初期の進歩
- Authors: Sean Moran,
- Abstract要約: ハッシュベースの手法は、高次元データをコンパクトなバイナリコードにマッピングすることで効率的な解を提供する。
過去20年にわたって、データから投影関数と量子化関数が最適化されるハッシュの学習について、かなりの研究が行われてきた。
この記事は、この分野を形作る中核的なアイデアに重点を置いて、早期学習に基づくハッシュ手法に関する基礎的な調査を提供する。
- 参考スコア(独自算出の注目度): 0.5279475826661642
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Approximate Nearest Neighbour (ANN) search is a fundamental problem in information retrieval, underpinning large-scale applications in computer vision, natural language processing, and cross-modal search. Hashing-based methods provide an efficient solution by mapping high-dimensional data into compact binary codes that enable fast similarity computations in Hamming space. Over the past two decades, a substantial body of work has explored learning to hash, where projection and quantisation functions are optimised from data rather than chosen at random. This article offers a foundational survey of early learning-based hashing methods, with an emphasis on the core ideas that shaped the field. We review supervised, unsupervised, and semi-supervised approaches, highlighting how projection functions are designed to generate meaningful embeddings and how quantisation strategies convert these embeddings into binary codes. We also examine extensions to multi-bit and multi-threshold models, as well as early advances in cross-modal retrieval. Rather than providing an exhaustive account of the most recent methods, our goal is to introduce the conceptual foundations of learning-based hashing for ANN search. By situating these early models in their historical context, we aim to equip readers with a structured understanding of the principles, trade-offs, and open challenges that continue to inform current research in this area.
- Abstract(参考訳): ANN (Approximate Nearest Neighbour) 探索は情報検索の基本的な問題であり、コンピュータビジョン、自然言語処理、モーダル検索における大規模応用の基盤となっている。
ハッシュベースの手法は、ハミング空間における高速な類似性計算を可能にするため、高次元データをコンパクトなバイナリコードにマッピングすることで効率的な解を提供する。
過去20年間、かなりの量の研究がハッシュ学習を探求し、予測関数と量子化関数はランダムに選択されるのではなく、データから最適化されている。
この記事は、この分野を形作る中核的なアイデアに重点を置いて、早期学習に基づくハッシュ手法に関する基礎的な調査を提供する。
我々は、プロジェクション関数が意味のある埋め込みを生成するように設計されているか、量子化戦略がこれらの埋め込みをバイナリコードに変換する方法について、教師付き、教師なし、半教師付きアプローチをレビューする。
また、マルチビットおよびマルチスレッドモデルの拡張や、クロスモーダル検索の早期進歩についても検討する。
我々のゴールは、最新の手法の徹底的な説明を提供するのではなく、ANN検索のための学習ベースのハッシュの概念的基礎を導入することである。
これらの初期のモデルを歴史的文脈に配置することで、我々は、この領域における現在の研究に影響を与え続ける、原則、トレードオフ、オープンな課題に関する構造化された理解を読者に提供することを目指している。
関連論文リスト
- Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文 参考訳(メタデータ) (2024-11-18T16:15:17Z) - From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models [63.188607839223046]
この調査は、推論中に計算をスケールするメリットに焦点を当てている。
我々はトークンレベルの生成アルゴリズム、メタジェネレーションアルゴリズム、効率的な生成という3つの領域を統一的な数学的定式化の下で探索する。
論文 参考訳(メタデータ) (2024-06-24T17:45:59Z) - Efficient Cross-Modal Retrieval via Deep Binary Hashing and Quantization [5.799838997511804]
クロスモーダル検索は、異なるコンテンツモダリティにまたがる類似の意味を持つデータを検索することを目的としている。
クロスモーダル検索のための共同学習型ディープハッシュ・量子化ネットワーク(HQ)を提案する。
NUS-WIDE、MIR-Flickr、Amazonデータセットの実験結果は、HQの精度が7%以上向上していることを示している。
論文 参考訳(メタデータ) (2022-02-15T22:00:04Z) - Unsupervised Deep Cross-modality Spectral Hashing [65.3842441716661]
このフレームワークは、最適化をバイナリ最適化とハッシュ関数学習に分離する2段階のハッシュアプローチである。
本稿では,単一モダリティと二項相互モダリティを同時に学習するスペクトル埋め込みに基づく新しいアルゴリズムを提案する。
我々は、画像に強力なCNNを活用し、テキストモダリティを学ぶためのCNNベースのディープアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-08-01T09:20:11Z) - A Survey on Deep Hashing Methods [52.326472103233854]
最寄りの検索は、データベースからクエリまでの距離が最小のサンプルを取得することを目的としている。
ディープラーニングの発展により、ディープハッシュ法は従来の方法よりも多くの利点を示す。
深い教師付きハッシュは、ペアワイズ法、ランキングベースの方法、ポイントワイズ法、量子化に分類される。
深い教師なしハッシュは、類似性再構築に基づく方法、擬似ラベルに基づく方法、予測自由な自己教師あり学習に基づく方法に分類される。
論文 参考訳(メタデータ) (2020-03-04T08:25:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。