論文の概要: Creating Something from Nothing: Unsupervised Knowledge Distillation for
Cross-Modal Hashing
- arxiv url: http://arxiv.org/abs/2004.00280v1
- Date: Wed, 1 Apr 2020 08:32:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 18:54:43.812505
- Title: Creating Something from Nothing: Unsupervised Knowledge Distillation for
Cross-Modal Hashing
- Title(参考訳): 無から何かを作る:クロスモーダルハッシュのための教師なし知識蒸留
- Authors: Hengtong Hu, Lingxi Xie, Richang Hong, Qi Tian
- Abstract要約: クロスモーダルハッシュ(CMH)は、特に視覚や言語において、異なるモーダルからのコンテンツを同じ空間にマッピングすることができる。
CMHには2つの主要なフレームワークがある。
本稿では,教師なし手法を用いて教師なし手法を導出する手法を提案する。
- 参考スコア(独自算出の注目度): 132.22315429623575
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, cross-modal hashing (CMH) has attracted increasing
attentions, mainly because its potential ability of mapping contents from
different modalities, especially in vision and language, into the same space,
so that it becomes efficient in cross-modal data retrieval. There are two main
frameworks for CMH, differing from each other in whether semantic supervision
is required. Compared to the unsupervised methods, the supervised methods often
enjoy more accurate results, but require much heavier labors in data
annotation. In this paper, we propose a novel approach that enables guiding a
supervised method using outputs produced by an unsupervised method.
Specifically, we make use of teacher-student optimization for propagating
knowledge. Experiments are performed on two popular CMH benchmarks, i.e., the
MIRFlickr and NUS-WIDE datasets. Our approach outperforms all existing
unsupervised methods by a large margin.
- Abstract(参考訳): 近年,クロスモーダル・ハッシュ(CMH)が注目されているのは,特に視覚や言語など,異なるモーダルから同じ空間にコンテンツをマッピングできる可能性から,クロスモーダルデータ検索の効率が向上している点である。
CMHには2つの主要なフレームワークがある。
教師なしメソッドと比較すると、教師なしメソッドはより正確な結果を享受することが多いが、データアノテーションにはるかに重い労力を必要とする。
本稿では,教師なし手法によって生成された出力を用いて教師付きメソッドを誘導する手法を提案する。
具体的には,教師-学生最適化を知識の伝播に活用する。
MIRFlickrとNUS-WIDEデータセットという2つの人気のあるCMHベンチマークで実験が行われる。
我々の手法は、既存の教師なし手法を大きなマージンで上回る。
関連論文リスト
- DANCE: Dual-View Distribution Alignment for Dataset Condensation [39.08022095906364]
我々は、データセットのコンディエンテーション(DANCE)のためのDMベースの新しいDual-view Distribution AligNmentを提案する。
具体的には、内部クラスの観点から複数の「中間エンコーダ」を構築し、擬似的な長期分布アライメントを行う。
クラス間の観点からは,分布キャリブレーションを行うために専門家モデルを用いる。
論文 参考訳(メタデータ) (2024-06-03T07:22:17Z) - A Dimensional Structure based Knowledge Distillation Method for
Cross-Modal Learning [15.544134849816528]
簡単な作業から抽出した特徴を解析・観察することで特徴識別性と次元構造(DS)の相関を見いだす。
クロスモーダル・ナレッジ・蒸留法 (CMKD) を提案し, 教師付きクロスモーダル・ラーニング (CML) の性能向上を図る。
提案手法は, チャネル的に独立して, 中間的な特徴を均一に分散させることで, その精度を高めるために, 難易度から意味的に無関係な特徴を学習する。
論文 参考訳(メタデータ) (2023-06-28T07:29:26Z) - MA2CL:Masked Attentive Contrastive Learning for Multi-Agent
Reinforcement Learning [128.19212716007794]
我々はtextbfMulti-textbfAgent textbfMasked textbfAttentive textbfContrastive textbfLearning (MA2CL) という効果的なフレームワークを提案する。
MA2CLは、潜伏空間におけるマスクされたエージェント観察を再構築することにより、時間的およびエージェントレベルの予測の両方の学習表現を奨励する。
提案手法は,様々なMARLアルゴリズムの性能とサンプル効率を大幅に向上させ,様々な視覚的,状態的シナリオにおいて,他の手法よりも優れる。
論文 参考訳(メタデータ) (2023-06-03T05:32:19Z) - Deep Manifold Hashing: A Divide-and-Conquer Approach for Semi-Paired
Unsupervised Cross-Modal Retrieval [44.35575925811005]
クロスモーダルハッシュ法は、多くのラベル付き情報を持つ完全なペアリングされたデータが存在しない場合、通常、モダリティギャップを越えて失敗する。
半ペア型教師なしクロスモーダル検索の問題を3つのサブプロブレムに分割する手法として,Deep Manifold Hashing (DMH)を提案する。
3つのベンチマークによる実験は、最先端の完全対向型および半対向型非教師付きクロスモーダルハッシュ法と比較して、DMHの優位性を示している。
論文 参考訳(メタデータ) (2022-09-26T11:47:34Z) - CMD: Self-supervised 3D Action Representation Learning with Cross-modal
Mutual Distillation [130.08432609780374]
3D行動認識では、骨格のモダリティの間に豊富な相補的な情報が存在する。
本稿では,CMD(Cross-modal Mutual Distillation)フレームワークを提案する。
提案手法は,既存の自己管理手法より優れ,新しい記録を多数設定する。
論文 参考訳(メタデータ) (2022-08-26T06:06:09Z) - Semi-supervised Semantic Segmentation with Mutual Knowledge Distillation [20.741353967123366]
相互知識蒸留(MKD)と呼ばれる新しい整合正則化フレームワークを提案する。
我々は,教師が生み出した擬似ラベルを用いて,学生ネットワークを監督し,両者の相互知識の蒸留を実現する。
我々のフレームワークは、様々な半教師付き環境下で、従来の最先端(SOTA)メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-08-24T12:47:58Z) - Revisiting Contrastive Methods for Unsupervised Learning of Visual
Representations [78.12377360145078]
対照的な自己教師型学習は、セグメンテーションやオブジェクト検出といった多くの下流タスクにおいて教師付き事前訓練よりも優れています。
本稿では,データセットのバイアスが既存手法にどのように影響するかを最初に検討する。
現在のコントラストアプローチは、(i)オブジェクト中心対シーン中心、(ii)一様対ロングテール、(iii)一般対ドメイン固有データセットなど、驚くほどうまく機能することを示す。
論文 参考訳(メタデータ) (2021-06-10T17:59:13Z) - CIMON: Towards High-quality Hash Codes [63.37321228830102]
我々はtextbfComprehensive stextbfImilarity textbfMining と ctextbfOnsistency leartextbfNing (CIMON) という新しい手法を提案する。
まず、グローバルな洗練と類似度統計分布を用いて、信頼性とスムーズなガイダンスを得る。第二に、意味的整合性学習とコントラスト的整合性学習の両方を導入して、乱不変と差別的ハッシュコードの両方を導出する。
論文 参考訳(メタデータ) (2020-10-15T14:47:14Z) - Unsupervised Deep Cross-modality Spectral Hashing [65.3842441716661]
このフレームワークは、最適化をバイナリ最適化とハッシュ関数学習に分離する2段階のハッシュアプローチである。
本稿では,単一モダリティと二項相互モダリティを同時に学習するスペクトル埋め込みに基づく新しいアルゴリズムを提案する。
我々は、画像に強力なCNNを活用し、テキストモダリティを学ぶためのCNNベースのディープアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-08-01T09:20:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。