論文の概要: Asymmetric Scalable Cross-modal Hashing
- arxiv url: http://arxiv.org/abs/2207.12650v1
- Date: Tue, 26 Jul 2022 04:38:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-27 13:18:54.296324
- Title: Asymmetric Scalable Cross-modal Hashing
- Title(参考訳): 非対称スケーラブルクロスモーダルハッシュ
- Authors: Wenyun Li, Chi-Man Pun
- Abstract要約: クロスモーダルハッシュは、大規模なマルチメディア検索問題を解決する方法として成功している。
これらの問題に対処する新しい非対称スケーラブルクロスモーダルハッシュ(ASCMH)を提案する。
我々のASCMHは、最先端のクロスモーダルハッシュ法よりも精度と効率の点で優れています。
- 参考スコア(独自算出の注目度): 51.309905690367835
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cross-modal hashing is a successful method to solve large-scale multimedia
retrieval issue. A lot of matrix factorization-based hashing methods are
proposed. However, the existing methods still struggle with a few problems,
such as how to generate the binary codes efficiently rather than directly relax
them to continuity. In addition, most of the existing methods choose to use an
$n\times n$ similarity matrix for optimization, which makes the memory and
computation unaffordable. In this paper we propose a novel Asymmetric Scalable
Cross-Modal Hashing (ASCMH) to address these issues. It firstly introduces a
collective matrix factorization to learn a common latent space from the
kernelized features of different modalities, and then transforms the similarity
matrix optimization to a distance-distance difference problem minimization with
the help of semantic labels and common latent space. Hence, the computational
complexity of the $n\times n$ asymmetric optimization is relieved. In the
generation of hash codes we also employ an orthogonal constraint of label
information, which is indispensable for search accuracy. So the redundancy of
computation can be much reduced. For efficient optimization and scalable to
large-scale datasets, we adopt the two-step approach rather than optimizing
simultaneously. Extensive experiments on three benchmark datasets: Wiki,
MIRFlickr-25K, and NUS-WIDE, demonstrate that our ASCMH outperforms the
state-of-the-art cross-modal hashing methods in terms of accuracy and
efficiency.
- Abstract(参考訳): クロスモーダルハッシュ(cross-modal hashing)は、大規模マルチメディア検索問題を解決する手法である。
行列分解に基づくハッシュ法が多数提案されている。
しかし、既存のメソッドは、連続性に直接緩和するのではなく、バイナリコードを効率的に生成する方法など、いくつかの問題に悩まされている。
加えて、既存のメソッドの多くは最適化のために$n\times n$ similarity matrixを使用しており、これによりメモリと計算は耐えられない。
本稿では,これらの問題に対処する新しい非対称スケーラブルクロスモーダルハッシュ(ASCMH)を提案する。
まず、異なるモジュラリティのカーネル化された特徴から共通潜在空間を学習するための集合行列分解を導入し、その後、類似性行列最適化をセマンティックラベルと共通潜在空間の助けを借りて距離距離差問題最小化に変換する。
したがって、$n\times n$非対称最適化の計算複雑性は軽減される。
ハッシュ符号の生成ではラベル情報の直交制約も採用しており,検索精度には不可欠である。
したがって、計算の冗長性は大幅に削減できる。
効率的な最適化と大規模データセットへのスケーラブル化のために、同時に最適化するのではなく、2段階のアプローチを採用する。
Wiki, MIRFlickr-25K, NUS-WIDEの3つのベンチマークデータセットに対する大規模な実験は、我々のASCMHが精度と効率の点で最先端のクロスモーダルハッシュ法より優れていることを示した。
関連論文リスト
- An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - Accelerating Cutting-Plane Algorithms via Reinforcement Learning
Surrogates [49.84541884653309]
凸離散最適化問題に対する現在の標準的なアプローチは、カットプレーンアルゴリズムを使うことである。
多くの汎用カット生成アルゴリズムが存在するにもかかわらず、大規模な離散最適化問題は、難易度に悩まされ続けている。
そこで本研究では,強化学習による切削平面アルゴリズムの高速化手法を提案する。
論文 参考訳(メタデータ) (2023-07-17T20:11:56Z) - Fast Differentiable Matrix Square Root and Inverse Square Root [65.67315418971688]
微分可能な行列平方根と逆平方根を計算するためのより効率的な2つの変種を提案する。
前方伝搬には, Matrix Taylor Polynomial (MTP) を用いる方法と, Matrix Pad'e Approximants (MPA) を使用する方法がある。
一連の数値実験により、両方の手法がSVDやNSの繰り返しと比較してかなりスピードアップすることが示された。
論文 参考訳(メタデータ) (2022-01-29T10:00:35Z) - FDDH: Fast Discriminative Discrete Hashing for Large-Scale Cross-Modal
Retrieval [41.125141897096874]
クロスモーダルハッシュはその有効性と効率性に好まれる。
既存のほとんどのメソッドは、ハッシュコードを学ぶ際に意味情報の識別力を十分に利用していない。
大規模クロスモーダル検索のためのFDDH(Fast Discriminative Discrete Hashing)手法を提案する。
論文 参考訳(メタデータ) (2021-05-15T03:53:48Z) - A non-alternating graph hashing algorithm for large scale image search [5.221613241320111]
本稿では,問題に追加変数を付加しないスペクトルハッシュのための新しい緩和定式化を提案する。
変数の数がデータポイントと等しい元のスペースの問題を解決する代わりに、我々ははるかに小さなスペースで問題を解決します。
このトリックは、メモリと計算の複雑さを同時に軽減します。
論文 参考訳(メタデータ) (2020-12-24T06:41:54Z) - CIMON: Towards High-quality Hash Codes [63.37321228830102]
我々はtextbfComprehensive stextbfImilarity textbfMining と ctextbfOnsistency leartextbfNing (CIMON) という新しい手法を提案する。
まず、グローバルな洗練と類似度統計分布を用いて、信頼性とスムーズなガイダンスを得る。第二に、意味的整合性学習とコントラスト的整合性学習の両方を導入して、乱不変と差別的ハッシュコードの両方を導出する。
論文 参考訳(メタデータ) (2020-10-15T14:47:14Z) - Revisiting Co-Occurring Directions: Sharper Analysis and Efficient
Algorithm for Sparse Matrices [23.22254890452548]
近似行列乗算(AMM)のストリーミングモデルについて検討する。
我々は、アルゴリズムが限られたメモリでデータを1回だけ渡すことができるというシナリオに興味を持っている。
AMMストリーミングのための最先端決定論的スケッチアルゴリズムは共起方向(COD)である
論文 参考訳(メタデータ) (2020-09-05T15:35:59Z) - Task-adaptive Asymmetric Deep Cross-modal Hashing [20.399984971442]
クロスモーダルハッシュは、異質なモダリティデータのセマンティックな相関関係を、識別的なセマンティックラベルを持つバイナリハッシュコードに埋め込むことを目的としている。
本稿では,タスク適応型非対称ディープクロスモーダルハッシュ(TA-ADCMH)法を提案する。
同時モーダル表現と非対称ハッシュ学習により,2つのサブ検索タスクに対するタスク適応型ハッシュ関数を学習することができる。
論文 参考訳(メタデータ) (2020-04-01T02:09:20Z) - Multi-Objective Matrix Normalization for Fine-grained Visual Recognition [153.49014114484424]
双線形プールは細粒度視覚認識(FGVC)において大きな成功を収める
近年,行列パワー正規化は双線形特徴量において2次情報を安定化させることができることが示されている。
両線形表現を同時に正規化できる効率的な多目的行列正規化法(MOMN)を提案する。
論文 参考訳(メタデータ) (2020-03-30T08:40:35Z) - Image Hashing by Minimizing Discrete Component-wise Wasserstein Distance [12.968141477410597]
競合するオートエンコーダは、バランスよく高品質なハッシュコードを生成する堅牢で局所性を保存するハッシュ関数を暗黙的に学習できることが示されている。
既存の逆ハッシュ法は、大規模な画像検索に非効率である。
本稿では,サンプル要求と計算コストを大幅に低減した,新しい対向型オートエンコーダハッシュ手法を提案する。
論文 参考訳(メタデータ) (2020-02-29T00:22:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。