論文の概要: EVA: Mixture-of-Experts Semantic Variant Alignment for Compositional Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2506.20986v1
- Date: Thu, 26 Jun 2025 04:00:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.967133
- Title: EVA: Mixture-of-Experts Semantic Variant Alignment for Compositional Zero-Shot Learning
- Title(参考訳): EVA:コンポジションゼロショット学習のためのセマンティック・バリアントアライメント
- Authors: Xiao Zhang, Yongqiang Ma, Haodong Jing, Nanning Zheng,
- Abstract要約: 合成ゼロショット学習(CZSL)のための混在型セマンティック・バリアントアライメント・フレームワークであるEVAを提案する。
具体的には、複数のエキスパートを活用してトークン認識学習を実現し、高品質なプリミティブ表現をモデル化するドメインエキスパート適応を導入する。
本手法は, クローズド・オープン・ワールド・セッティングの3つのベンチマークにおいて, 最先端のCZSL法よりも優れていた。
- 参考スコア(独自算出の注目度): 31.95599022275838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compositional Zero-Shot Learning (CZSL) investigates compositional generalization capacity to recognize unknown state-object pairs based on learned primitive concepts. Existing CZSL methods typically derive primitives features through a simple composition-prototype mapping, which is suboptimal for a set of individuals that can be divided into distinct semantic subsets. Moreover, the all-to-one cross-modal primitives matching neglects compositional divergence within identical states or objects, limiting fine-grained image-composition alignment. In this study, we propose EVA, a Mixture-of-Experts Semantic Variant Alignment framework for CZSL. Specifically, we introduce domain-expert adaption, leveraging multiple experts to achieve token-aware learning and model high-quality primitive representations. To enable accurate compositional generalization, we further present semantic variant alignment to select semantically relevant representation for image-primitives matching. Our method significantly outperforms other state-of-the-art CZSL methods on three popular benchmarks in both closed- and open-world settings, demonstrating the efficacy of the proposed insight.
- Abstract(参考訳): 合成ゼロショット学習(CZSL)は、未知の状態オブジェクト対を学習原始概念に基づいて認識するための合成一般化能力を調べる。
既存のCZSL法は、単純な合成-プロトタイプマッピングを通じてプリミティブの特徴を導き出すのが一般的である。
さらに、全対一のクロスモーダルプリミティブマッチングは、同一の状態またはオブジェクト内の構成のばらつきを無視し、きめ細かい画像合成アライメントを制限する。
そこで本研究では,CZSL用セマンティック・バリアント・アライメント・フレームワークであるEVAを提案する。
具体的には、複数のエキスパートを活用してトークン認識学習を実現し、高品質なプリミティブ表現をモデル化するドメインエキスパート適応を導入する。
正確な合成一般化を実現するため,画像主観的マッチングのための意味的関連表現を選択するための意味的変分アライメントを提案する。
提案手法は, クローズド・オープン・ワールド・セッティングの3つのベンチマークにおいて, 従来のCZSL法よりも優れており, 提案手法の有効性を実証している。
関連論文リスト
- Learning Clustering-based Prototypes for Compositional Zero-shot Learning [56.57299428499455]
ClusProは、コンポジションゼロショット学習のための堅牢なクラスタリングベースのプロトタイプマイニングフレームワークである。
それは、多様化されたプロトタイプの集合を通じて、プリミティブの概念的境界を定義する。
ClusProは、学習可能なパラメータを追加することなく、非パラメトリックな方法でプロトタイプクラスタリングを効率的に実行する。
論文 参考訳(メタデータ) (2025-02-10T14:20:01Z) - Graph-guided Cross-composition Feature Disentanglement for Compositional Zero-shot Learning [54.08741382593959]
合成ゼロショット学習(CZSL)において、プリミティブ(属性とオブジェクト)の視覚的特徴の歪みは例外的な結果を示した。
異なる構成にまたがる一般的な非絡み合った原始的特徴を学ぶことは困難である。
本稿では,複数のプリミティブ共有合成を入力として利用するクロスコンポジション特徴分散の解を提案する。
論文 参考訳(メタデータ) (2024-08-19T08:23:09Z) - Hierarchical Visual Primitive Experts for Compositional Zero-Shot
Learning [52.506434446439776]
合成ゼロショット学習(CZSL)は、既知のプリミティブ(属性とオブジェクト)の事前知識で構成を認識することを目的としている。
このような問題に対処するために,コンポジショントランスフォーマー(CoT)と呼ばれるシンプルでスケーラブルなフレームワークを提案する。
提案手法は,MIT-States,C-GQA,VAW-CZSLなど,いくつかのベンチマークでSoTA性能を実現する。
論文 参考訳(メタデータ) (2023-08-08T03:24:21Z) - Prompting Language-Informed Distribution for Compositional Zero-Shot Learning [73.49852821602057]
合成ゼロショット学習(CZSL)タスクは、目に見えない合成視覚概念を認識することを目的としている。
本稿では,タスクに対して言語インフォームド分布(PLID)を指示するモデルを提案する。
MIT-States、UT-Zappos、C-GQAデータセットの実験結果は、PLIDの先行技術よりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-05-23T18:00:22Z) - Troika: Multi-Path Cross-Modal Traction for Compositional Zero-Shot Learning [37.445883075993414]
近年のコンポジションゼロショット学習 (CZSL) 法は, コンポジションオブジェクト対にのみトレーニング可能なプロンプトを構築することで, 事前学習された視覚言語モデル (VLM) に適応している。
CZSLモデルのための新しいパラダイムを提案し、状態、対象、構成を協調的にモデル化する3つの識別分岐(Multi-Path)を確立する。
提案手法は,クローズドワールドとオープンワールドの両設定において,既存の手法を著しく上回っている。
論文 参考訳(メタデータ) (2023-03-27T14:10:26Z) - ProCC: Progressive Cross-primitive Compatibility for Open-World
Compositional Zero-Shot Learning [29.591615811894265]
Open-World Composal Zero-shot Learning (OW-CZSL) は、コンポジション空間に先立って、画像中の状態とオブジェクトプリミティブの新規なコンポジションを認識することを目的としている。
本稿では,OW-CZSLタスクの学習過程を模倣する,Progressive Cross-primitive Compatibility (ProCC) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-11-19T10:09:46Z) - Learning Invariant Visual Representations for Compositional Zero-Shot
Learning [30.472541551048508]
合成ゼロショット学習 (CZSL) は,目に見える対象の合成から学習した知識を用いて,新しい構成を認識することを目的としている。
本稿では,異なる領域を表現レベルと勾配レベルで整列させる不変な特徴学習フレームワークを提案する。
2つのCZSLベンチマーク実験により,提案手法が従来の最先端技術よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-06-01T11:33:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。