論文の概要: Hashing-Baseline: Rethinking Hashing in the Age of Pretrained Models
- arxiv url: http://arxiv.org/abs/2509.14427v1
- Date: Wed, 17 Sep 2025 20:58:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:52.97229
- Title: Hashing-Baseline: Rethinking Hashing in the Age of Pretrained Models
- Title(参考訳): ハッシュベースライン:事前訓練モデルの時代におけるハッシュの再考
- Authors: Ilyass Moummad, Kawtar Zaher, Lukas Rauch, Alexis Joly,
- Abstract要約: 本稿では,Hash-Baselineについて紹介する。Hash-Baselineは強力な事前学習型エンコーダを利用して,豊富な事前学習型埋め込みを生成する。
提案手法は,最先端の視覚とオーディオエンコーダの凍結埋め込みと組み合わせて,さらなる学習や微調整を行うことなく,競争力のある検索性能を得る。
- 参考スコア(独自算出の注目度): 4.531902882476647
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Information retrieval with compact binary embeddings, also referred to as hashing, is crucial for scalable fast search applications, yet state-of-the-art hashing methods require expensive, scenario-specific training. In this work, we introduce Hashing-Baseline, a strong training-free hashing method leveraging powerful pretrained encoders that produce rich pretrained embeddings. We revisit classical, training-free hashing techniques: principal component analysis, random orthogonal projection, and threshold binarization, to produce a strong baseline for hashing. Our approach combines these techniques with frozen embeddings from state-of-the-art vision and audio encoders to yield competitive retrieval performance without any additional learning or fine-tuning. To demonstrate the generality and effectiveness of this approach, we evaluate it on standard image retrieval benchmarks as well as a newly introduced benchmark for audio hashing.
- Abstract(参考訳): コンパクトなバイナリ埋め込みを用いた情報検索は、スケーラブルな高速検索アプリケーションには不可欠であるが、最先端のハッシュ手法では、高価なシナリオ固有のトレーニングが必要である。
本研究では,Hash-Baselineについて紹介する。Hash-Baselineは強力な事前学習型エンコーダを利用して,豊富な事前学習型埋め込みを生成する。
我々は、古典的、トレーニング不要なハッシュ技術(主成分分析、ランダム直交射影、しきい値二項化)を再検討し、ハッシュのための強力なベースラインを創出する。
提案手法は,最先端の視覚とオーディオエンコーダの凍結埋め込みと組み合わせて,さらなる学習や微調整を行うことなく,競争力のある検索性能を得る。
提案手法の汎用性と有効性を示すため,提案手法を標準画像検索ベンチマークと,新たに導入された音声ハッシュのベンチマークで評価した。
関連論文リスト
- A Survey on Deep Text Hashing: Efficient Semantic Text Retrieval with Binary Representation [69.50397417361351]
テキストハッシュはオリジナルのテキストをコンパクトなバイナリハッシュコードに投影する。
ディープテキストハッシュは、従来のデータに依存しないハッシュ技術よりも大きなアドバンテージを示している。
本調査では, コアコンポーネントに基づいて分類することで, 現在の深層テキストハッシュ法について検討する。
論文 参考訳(メタデータ) (2025-10-31T06:51:37Z) - HASH-RAG: Bridging Deep Hashing with Retriever for Efficient, Fine Retrieval and Augmented Generation [16.147618749631103]
Hash-RAGは、ディープハッシュ技術とシステマティック最適化を統合するフレームワークである。
このハッシュベースの効率的な検索フレームワークを基盤として,きめ細かなチャンクの基盤を確立する。
論文 参考訳(メタデータ) (2025-05-22T02:22:11Z) - KALAHash: Knowledge-Anchored Low-Resource Adaptation for Deep Hashing [19.667480064079083]
既存のディープハッシュ手法は豊富なトレーニングデータに依存しており、低リソース適応のより困難なシナリオは比較的過小評価されている。
そこで我々は,クラスレベルのテキスト知識の埋め込みを活用することで,低ランク適応を動的に構築する新しいプラグイン・アンド・プレイアプローチであるClass-Calibration LoRAを紹介する。
提案手法であるKnowledge-Anchored Low-Resource Adaptation Hashing (KALAHash)は,検索性能を大幅に向上し,低リソースシナリオにおけるデータ効率を4倍に向上させる。
論文 参考訳(メタデータ) (2024-12-27T03:04:54Z) - Learning to Hash for Recommendation: A Survey [49.943390288789494]
このサーベイは、最先端のHashRecアルゴリズムの概要を提供する。
既存の研究を,(i)学習目標,(ii)最適化戦略,(iii)推薦シナリオに基づく3段階の分類に分類する。
論文 参考訳(メタデータ) (2024-12-05T05:07:19Z) - A Lower Bound of Hash Codes' Performance [122.88252443695492]
本稿では,ハッシュ符号間のクラス間の差分性とクラス内圧縮性が,ハッシュ符号の性能の低い境界を決定することを証明する。
次に、ハッシュコードの後部を推定し、それを制御することにより、上記の目的を完全に活用する代理モデルを提案し、低バイアス最適化を実現する。
一連のハッシュモデルをテストすることで、平均精度が最大で26.5%、精度が最大で20.5%向上した。
論文 参考訳(メタデータ) (2022-10-12T03:30:56Z) - CoopHash: Cooperative Learning of Multipurpose Descriptor and Contrastive Pair Generator via Variational MCMC Teaching for Supervised Image Hashing [42.67510119856105]
GAN(Generative Adversarial Networks)のような生成モデルは、画像ハッシュモデルで合成データを生成することができる。
GANは訓練が難しいため、ハッシュアプローチが生成モデルとハッシュ関数を共同で訓練するのを防ぐことができる。
本稿では,エネルギーをベースとした協調学習に基づく新しい協調ハッシュネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-09T15:42:36Z) - Unsupervised Hashing with Contrastive Information Bottleneck [39.607741586731336]
バイナリハッシュコードを学ぶためのフレームワークの適応を提案する。
具体的には、ハッシュの特定の要件を満たすために、まず目的関数を変更することを提案する。
次に、エンドツーエンドのトレーニングを容易にする確率的バイナリ表現層をモデルに導入する。
論文 参考訳(メタデータ) (2021-05-13T08:30:16Z) - CIMON: Towards High-quality Hash Codes [63.37321228830102]
我々はtextbfComprehensive stextbfImilarity textbfMining と ctextbfOnsistency leartextbfNing (CIMON) という新しい手法を提案する。
まず、グローバルな洗練と類似度統計分布を用いて、信頼性とスムーズなガイダンスを得る。第二に、意味的整合性学習とコントラスト的整合性学習の両方を導入して、乱不変と差別的ハッシュコードの両方を導出する。
論文 参考訳(メタデータ) (2020-10-15T14:47:14Z) - Deep Reinforcement Learning with Label Embedding Reward for Supervised
Image Hashing [85.84690941656528]
深層型ハッシュのための新しい意思決定手法を提案する。
我々はBose-Chaudhuri-Hocquenghem符号で定義された新しいラベル埋め込み報酬を用いて、深いQ-ネットワークを学ぶ。
我々の手法は、様々なコード長で最先端の教師付きハッシュ法より優れています。
論文 参考訳(メタデータ) (2020-08-10T09:17:20Z) - Unsupervised Deep Cross-modality Spectral Hashing [65.3842441716661]
このフレームワークは、最適化をバイナリ最適化とハッシュ関数学習に分離する2段階のハッシュアプローチである。
本稿では,単一モダリティと二項相互モダリティを同時に学習するスペクトル埋め込みに基づく新しいアルゴリズムを提案する。
我々は、画像に強力なCNNを活用し、テキストモダリティを学ぶためのCNNベースのディープアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-08-01T09:20:11Z) - Reinforcing Short-Length Hashing [61.75883795807109]
既存の手法は、非常に短いハッシュコードを用いた検索性能が劣っている。
本研究では, 短寿命ハッシュ(RSLH)を改良する新しい手法を提案する。
本稿では,ハッシュ表現とセマンティックラベルの相互再構成を行い,セマンティック情報を保存する。
3つの大規模画像ベンチマークの実験は、様々な短いハッシュシナリオ下でのRSLHの優れた性能を示す。
論文 参考訳(メタデータ) (2020-04-24T02:23:52Z) - A Survey on Deep Hashing Methods [52.326472103233854]
最寄りの検索は、データベースからクエリまでの距離が最小のサンプルを取得することを目的としている。
ディープラーニングの発展により、ディープハッシュ法は従来の方法よりも多くの利点を示す。
深い教師付きハッシュは、ペアワイズ法、ランキングベースの方法、ポイントワイズ法、量子化に分類される。
深い教師なしハッシュは、類似性再構築に基づく方法、擬似ラベルに基づく方法、予測自由な自己教師あり学習に基づく方法に分類される。
論文 参考訳(メタデータ) (2020-03-04T08:25:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。