論文の概要: Enabling Generalized Zero-shot Learning Towards Unseen Domains by Intrinsic Learning from Redundant LLM Semantics
- arxiv url: http://arxiv.org/abs/2403.14362v5
- Date: Mon, 10 Mar 2025 09:35:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:41:59.462535
- Title: Enabling Generalized Zero-shot Learning Towards Unseen Domains by Intrinsic Learning from Redundant LLM Semantics
- Title(参考訳): 冗長LLMセマンティックスからの本質的学習による未知領域への一般化ゼロショット学習の導入
- Authors: Jiaqi Yue, Chunhui Zhao, Jiancheng Zhao, Biao Huang,
- Abstract要約: 本稿では、GZSLに対処するクロスドメインGZSLについて検討する。
大規模言語モデル(LLM)を付加した冗長クラスセマンティクスによる情報非対称性問題を考えると,メタドメインアライメント・セマンティック・リファインメント(MDASR)を提案する。
MDASRは、冗長な意味空間と共通の特徴空間を効果的に整合させ、CDGZSLにおける情報の非対称性を緩和する。
- 参考スコア(独自算出の注目度): 21.51200099058331
- License:
- Abstract: Generalized zero-shot learning (GZSL) focuses on recognizing seen and unseen classes against domain shift problem where data of unseen classes may be misclassified as seen classes. However, existing GZSL is still limited to seen domains. In the current work, we study cross-domain GZSL (CDGZSL) which addresses GZSL towards unseen domains. Different from existing GZSL methods, CDGZSL constructs a common feature space across domains and acquires the corresponding intrinsic semantics shared among domains to transfer from seen to unseen domains. Considering the information asymmetry problem caused by redundant class semantics annotated with large language models (LLMs), we present Meta Domain Alignment Semantic Refinement (MDASR). Technically, MDASR consists of two parts: Inter-class similarity alignment, which eliminates the non-intrinsic semantics not shared across all domains under the guidance of inter-class feature relationships, and unseen-class meta generation, which preserves intrinsic semantics to maintain connectivity between seen and unseen classes by simulating feature generation. MDASR effectively aligns the redundant semantic space with the common feature space, mitigating the information asymmetry in CDGZSL. The effectiveness of MDASR is demonstrated on two datasets, Office-Home and Mini-DomainNet, and we have shared the LLM-based semantics for these datasets as a benchmark.
- Abstract(参考訳): 一般化ゼロショット学習(GZSL)は、見知らぬクラスのデータが見つからないクラスとして誤って分類される場合のドメインシフト問題に対して、目に見えないクラスと見えないクラスを認識することに焦点を当てる。
しかし、既存のGZSLは依然として見るドメインに限られている。
本研究では,GZSLを未確認領域に向けるクロスドメインGZSL(CDGZSL)について検討する。
既存のGZSL法とは異なり、CDGZSLはドメイン間で共通の特徴空間を構築し、ドメイン間で共有される固有の意味論を取得して、見えないドメインから見えないドメインへ転送する。
大規模言語モデル(LLM)に注釈付けされた冗長なクラスセマンティクスによる情報非対称性の問題を考慮して,メタドメインアライメント・セマンティック・リファインメント(MDASR)を提案する。
技術的には、MDASRは2つの部分から構成される: クラス間類似性アライメントは、クラス間特徴関係の指導の下ですべてのドメイン間で共有されていない非内在的意味論を排除する。
MDASRは、冗長な意味空間と共通の特徴空間を効果的に整合させ、CDGZSLにおける情報の非対称性を緩和する。
MDASRの有効性は、Office-HomeとMini-DomainNetの2つのデータセットで実証され、これらのデータセットに対するLLMベースのセマンティクスをベンチマークとして共有した。
関連論文リスト
- Exploring User Retrieval Integration towards Large Language Models for Cross-Domain Sequential Recommendation [66.72195610471624]
Cross-Domain Sequential Recommendationは、異なるドメイン間でユーザのシーケンシャルな好みをマイニングし、転送することを目的としている。
本稿では,ユーザ検索手法を探索し,CDSRの性能向上を目的とした URLLM という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T09:19:54Z) - Towards domain-invariant Self-Supervised Learning with Batch Styles
Standardization [1.6060199783864477]
Batch Styles Standardization (BSS) は、バッチ内の画像のスタイルを標準化するシンプルな手法である。
BSSは未確認領域でのダウンストリームタスク性能を著しく改善し、UDG手法よりも優れ、競合することが多い。
論文 参考訳(メタデータ) (2023-03-10T17:09:04Z) - Transferrable Contrastive Learning for Visual Domain Adaptation [108.98041306507372]
Transferrable Contrastive Learning (TCL) はドメイン適応に適した自己教師型学習パラダイムである。
TCLは、クリーンで斬新な対照的な損失を通じて、ソースとターゲット間のドメイン内ドメイン間の相違を罰する。
無料のランチは、対照的な学習が組み込まれているため、TCLは、ターゲットデータのための擬似ラベルの時間的にアンサンブルされたバージョンを自然に達成する、移動平均キーエンコーダに依存している。
論文 参考訳(メタデータ) (2021-12-14T16:23:01Z) - HSVA: Hierarchical Semantic-Visual Adaptation for Zero-Shot Learning [74.76431541169342]
ゼロショット学習(ZSL)は、目に見えないクラス認識の問題に取り組み、目に見えないクラスから目に見えないクラスに意味的な知識を移す。
本稿では,意味領域と視覚領域を協調させる新しい階層型意味視覚適応(HSVA)フレームワークを提案する。
4つのベンチマークデータセットの実験では、HSVAは従来のZSLと一般的なZSLの両方で優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-30T14:27:50Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - OntoZSL: Ontology-enhanced Zero-shot Learning [19.87808305218359]
Zero-shot Learning(ZSL)の実装の鍵は、クラス間の意味的な関係を構築するクラスの以前の知識を活用することです。
本稿では,zslのクラス間関係をモデル化するために,より豊かで競争力の高い事前知識を探索する。
目に見えないクラス間のデータ不均衡に対処するため,GAN(Generative Adversarial Networks)を用いた生成型ZSLフレームワークを開発した。
論文 参考訳(メタデータ) (2021-02-15T04:39:58Z) - Towards Recognizing Unseen Categories in Unseen Domains [74.29101415077523]
CuMixはZSL(Zero-Shot Learning)、ドメイン適応とドメイン一般化(Domain Adaptation and Domain Generalization、DG)、ZSL+DG(ZSL+DG)に取り組むための総合的なアルゴリズムである。
CuMixのキーとなるアイデアは、トレーニング中に使用可能な、目に見えないドメインやカテゴリからの画像と機能を使用して、テスト時のドメインとセマンティックシフトをシミュレートすることだ。
DomainNetベンチマークを用いた標準SLおよびDGデータセットとZSL+DGの結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-07-23T21:09:28Z) - Classes Matter: A Fine-grained Adversarial Approach to Cross-domain
Semantic Segmentation [95.10255219396109]
クラスレベルの特徴アライメントのための微粒な逆学習戦略を提案する。
ドメイン区別器として機能するだけでなく、クラスレベルでドメインを区別する、きめ細かいドメイン識別器を採用しています。
CCD (Class Center Distance) を用いた解析により, 粒度の細かい対角戦略により, クラスレベルのアライメントが向上することが確認された。
論文 参考訳(メタデータ) (2020-07-17T20:50:59Z) - Learning Cross-domain Semantic-Visual Relationships for Transductive
Zero-Shot Learning [29.498249893085287]
本研究では、トランスダクティブゼロショット学習(ZSL)へのトランスダクティブ・セマンティック・ビジュアル・リレーション(TSVR)アプローチを提案する。
TSVRは画像認識を再定義し、クラス属性と視覚的特徴からなる意味視覚融合のための類似性/相似性ラベルを予測する。
この問題に対して、類似のセマンティック・視覚対の数は、異種対のものとはかなり小さい。
論文 参考訳(メタデータ) (2020-03-31T11:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。