論文の概要: Visual-Semantic Graph Matching Net for Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2411.11351v1
- Date: Mon, 18 Nov 2024 07:43:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:33:02.900567
- Title: Visual-Semantic Graph Matching Net for Zero-Shot Learning
- Title(参考訳): ゼロショット学習のためのビジュアルセマンティックグラフマッチングネット
- Authors: Bowen Duan, Shiming Chen, Yufei Guo, Guo-Sen Xie, Weiping Ding, Yisong Wang,
- Abstract要約: Zero-shot Learning (ZSL) は、目に見えないクラスを認識するために追加のセマンティック情報を活用することを目的としている。
本稿では,ビジュアル・セマンティックな埋め込みを支援するために,VSGMNと呼ばれるビジュアル・セマンティックなグラフマッチングネットを提案する。
3つのベンチマークデータセットに対する大規模な実験は、VSGMNが従来のZSLシナリオと一般的なZSLシナリオの両方で優れたパフォーマンスを達成することを示した。
- 参考スコア(独自算出の注目度): 19.292080705525798
- License:
- Abstract: Zero-shot learning (ZSL) aims to leverage additional semantic information to recognize unseen classes. To transfer knowledge from seen to unseen classes, most ZSL methods often learn a shared embedding space by simply aligning visual embeddings with semantic prototypes. However, methods trained under this paradigm often struggle to learn robust embedding space because they align the two modalities in an isolated manner among classes, which ignore the crucial class relationship during the alignment process. To address the aforementioned challenges, this paper proposes a Visual-Semantic Graph Matching Net, termed as VSGMN, which leverages semantic relationships among classes to aid in visual-semantic embedding. VSGMN employs a Graph Build Network (GBN) and a Graph Matching Network (GMN) to achieve two-stage visual-semantic alignment. Specifically, GBN first utilizes an embedding-based approach to build visual and semantic graphs in the semantic space and align the embedding with its prototype for first-stage alignment. Additionally, to supplement unseen class relations in these graphs, GBN also build the unseen class nodes based on semantic relationships. In the second stage, GMN continuously integrates neighbor and cross-graph information into the constructed graph nodes, and aligns the node relationships between the two graphs under the class relationship constraint. Extensive experiments on three benchmark datasets demonstrate that VSGMN achieves superior performance in both conventional and generalized ZSL scenarios. The implementation of our VSGMN and experimental results are available at github: https://github.com/dbwfd/VSGMN
- Abstract(参考訳): Zero-shot Learning (ZSL) は、目に見えないクラスを認識するために追加のセマンティック情報を活用することを目的としている。
目に見えるクラスから目に見えないクラスに知識を移すため、ほとんどのZSLメソッドは、視覚的な埋め込みとセマンティックプロトタイプを単純に整列させることで、共有埋め込み空間を学習する。
しかしながら、このパラダイムの下で訓練された手法は、アライメント過程において重要なクラス関係を無視したクラス間で2つのモダリティを分離的に整列させるため、堅牢な埋め込み空間を学ぶのに苦労することが多い。
上記の課題に対処するため、視覚意味グラフマッチングネット(VSGMN)を提案し、クラス間の意味的関係を利用して視覚意味グラフの埋め込みを支援する。
VSGMNは、グラフビルドネットワーク(GBN)とグラフマッチングネットワーク(GMN)を使用して、2段階のビジュアル・セマンティックアライメントを実現する。
特に、GBNは、まず埋め込みベースのアプローチを使用して、セマンティック空間に視覚グラフとセマンティックグラフを構築し、その埋め込みを第一段階アライメントのプロトタイプと整列させる。
さらに、これらのグラフで見えないクラス関係を補うために、GBNは意味的関係に基づいて見えないクラスノードを構築する。
第2段階では、GMNは隣接するグラフとクロスグラフ情報を連続的に構築されたグラフノードに統合し、2つのグラフ間のノード関係をクラス関係制約の下で整列させる。
3つのベンチマークデータセットに対する大規模な実験は、VSGMNが従来のZSLシナリオと一般的なZSLシナリオの両方で優れたパフォーマンスを達成することを示した。
VSGMNの実装と実験結果は、github.com/dbwfd/VSGMNで利用可能です。
関連論文リスト
- LocalGCL: Local-aware Contrastive Learning for Graphs [17.04219759259025]
グラフ表現学習者として、アンダーラインローカル認識アンダーライングラフアンダーライン比較アンダーラインラーニング(textbfmethnametrim)を提案する。
実験は、最先端の手法に対するミートネームの優位性を検証し、包括的なグラフ表現学習者としての可能性を実証した。
論文 参考訳(メタデータ) (2024-02-27T09:23:54Z) - KMF: Knowledge-Aware Multi-Faceted Representation Learning for Zero-Shot
Node Classification [75.95647590619929]
Zero-Shot Node Classification (ZNC)は、グラフデータ分析において、新しく重要なタスクである。
ラベルセマンティクスの豊かさを向上する知識認識型多面的フレームワーク(KMF)を提案する。
ノード情報集約によるプロトタイプドリフトの問題を軽減するために,新しい幾何学的制約を開発した。
論文 参考訳(メタデータ) (2023-08-15T02:38:08Z) - Local Structure-aware Graph Contrastive Representation Learning [12.554113138406688]
複数のビューからノードの構造情報をモデル化するための局所構造対応グラフ比較表現学習法(LS-GCL)を提案する。
ローカルビューでは、各ターゲットノードのセマンティックサブグラフが共有GNNエンコーダに入力され、サブグラフレベルに埋め込まれたターゲットノードを取得する。
グローバルな視点では、元のグラフはノードの必要不可欠な意味情報を保存しているので、共有GNNエンコーダを利用して、グローバルなグラフレベルでターゲットノードの埋め込みを学習する。
論文 参考訳(メタデータ) (2023-08-07T03:23:46Z) - Contrastive Meta-Learning for Few-shot Node Classification [54.36506013228169]
少ないショットノード分類は、限定されたラベル付きノードのみを参照としてグラフ上のノードのラベルを予測することを目的としている。
グラフ上にCOSMICという新しい対照的なメタラーニングフレームワークを2つの重要な設計で作成する。
論文 参考訳(メタデータ) (2023-06-27T02:22:45Z) - ConGraT: Self-Supervised Contrastive Pretraining for Joint Graph and Text Embeddings [20.25180279903009]
テキスト分散グラフ(TAG)におけるテキストとノードの分離表現を共同学習するためのContrastive Graph-Text Pretraining(ConGraT)を提案する。
提案手法は言語モデル(LM)とグラフニューラルネットワーク(GNN)を訓練し,CLIPにインスパイアされたバッチワイドコントラスト学習目標を用いて,それらの表現を共通の潜在空間に整列させる。
実験により、ConGraTは、ノードとテキストのカテゴリ分類、リンク予測、言語モデリングなど、さまざまな下流タスクのベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-23T17:53:30Z) - Dual Contrastive Attributed Graph Clustering Network [6.796682703663566]
我々はDCAGC(Dual Contrastive Attributed Graph Clustering Network)と呼ばれる汎用フレームワークを提案する。
DCAGCでは、近隣のコントラストモジュールを利用することで、近隣ノードの類似性を最大化し、ノード表現の品質を向上させる。
DCAGCのすべてのモジュールは、統一されたフレームワークでトレーニングされ、最適化されているため、学習されたノード表現にはクラスタリング指向のメッセージが含まれている。
論文 参考訳(メタデータ) (2022-06-16T03:17:01Z) - Training Free Graph Neural Networks for Graph Matching [103.45755859119035]
TFGMは、グラフニューラルネットワーク(GNN)ベースのグラフマッチングのパフォーマンスをトレーニングなしで向上するフレームワークである。
TFGMをさまざまなGNNに適用することは、ベースラインよりも有望な改善を示している。
論文 参考訳(メタデータ) (2022-01-14T09:04:46Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Isometric Propagation Network for Generalized Zero-shot Learning [72.02404519815663]
一般的な戦略は、クラス属性の意味空間と、見たクラスとそのデータに基づいて画像の視覚空間とのマッピングを学ぶことである。
本稿では,各空間内のクラス間の関係を強化し,2つの空間におけるクラス依存性を整合させるIsometric propagation Network (IPN)を提案する。
IPNは3つの人気のあるゼロショット学習ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-02-03T12:45:38Z) - Contrastive and Generative Graph Convolutional Networks for Graph-based
Semi-Supervised Learning [64.98816284854067]
グラフベースのSemi-Supervised Learning (SSL)は、少数のラベル付きデータのラベルをグラフ経由で残りの巨大なラベル付きデータに転送することを目的としている。
本稿では,データ類似性とグラフ構造を両立させ,監視信号の強化を図るため,新しいGCNベースのSSLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-15T13:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。