論文の概要: $\text{H}^2$em: Learning Hierarchical Hyperbolic Embeddings for Compositional Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2512.20029v1
- Date: Tue, 23 Dec 2025 03:46:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.737254
- Title: $\text{H}^2$em: Learning Hierarchical Hyperbolic Embeddings for Compositional Zero-Shot Learning
- Title(参考訳): $\text{H}^2$em:Learning Hierarchical Hyperbolic Embeddings for compositional Zero-Shot Learning
- Authors: Lin Li, Jiahui Li, Jiaming Lei, Jun Xiao, Feifei Shao, Long Chen,
- Abstract要約: 合成ゼロショット学習(CZSL)は、原始体の訓練セット(状態と対象)から一般化することで、目に見えない状態オブジェクトの合成を認識することを目的としている。
現在の手法は、プリミティブのセマンティックな階層構造や、プリミティブとコンポジションの間の概念的な階層など、リッチな階層構造を見落としていることが多い。
CZSLのための階層型ハイパーボリックEMを学習する新しいフレームワークであるH2emを提案する。
- 参考スコア(独自算出の注目度): 18.502719006213635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compositional zero-shot learning (CZSL) aims to recognize unseen state-object compositions by generalizing from a training set of their primitives (state and object). Current methods often overlook the rich hierarchical structures, such as the semantic hierarchy of primitives (e.g., apple fruit) and the conceptual hierarchy between primitives and compositions (e.g, sliced apple apple). A few recent efforts have shown effectiveness in modeling these hierarchies through loss regularization within Euclidean space. In this paper, we argue that they fail to scale to the large-scale taxonomies required for real-world CZSL: the space's polynomial volume growth in flat geometry cannot match the exponential structure, impairing generalization capacity. To this end, we propose H2em, a new framework that learns Hierarchical Hyperbolic EMbeddings for CZSL. H2em leverages the unique properties of hyperbolic geometry, a space naturally suited for embedding tree-like structures with low distortion. However, a naive hyperbolic mapping may suffer from hierarchical collapse and poor fine-grained discrimination. We further design two learning objectives to structure this space: a Dual-Hierarchical Entailment Loss that uses hyperbolic entailment cones to enforce the predefined hierarchies, and a Discriminative Alignment Loss with hard negative mining to establish a large geodesic distance between semantically similar compositions. Furthermore, we devise Hyperbolic Cross-Modal Attention to realize instance-aware cross-modal infusion within hyperbolic geometry. Extensive ablations on three benchmarks demonstrate that H2em establishes a new state-of-the-art in both closed-world and open-world scenarios. Our codes will be released.
- Abstract(参考訳): 合成ゼロショット学習(CZSL)は、原始体の訓練セット(状態と対象)から一般化することで、目に見えない状態オブジェクトの合成を認識することを目的としている。
現在の手法は、プリミティブ(例えばリンゴの果実)のセマンティックな階層構造や、プリミティブとコンポジション(例えばスライスしたリンゴリンゴ)の概念的な階層構造など、リッチな階層構造を見落としていることが多い。
いくつかの最近の研究により、ユークリッド空間における損失正則化を通じてこれらの階層をモデル化する効果が示されている。
本稿では,空間の平坦な幾何学における多項式体積の増大は指数関数構造と一致せず,一般化能力を損なう。
この目的のために我々は,CZSLの階層的双曲EMベディングを学習する新しいフレームワークであるH2emを提案する。
H2em は双曲幾何学のユニークな性質を生かし、低歪みで木のような構造を埋め込むのに適した空間である。
しかし、ナイーブな双曲写像は階層的な崩壊と微粒化の少ない識別に悩まされる可能性がある。
我々はさらに、この空間を構築するための2つの学習目標を設計する: 双曲的エンタテインメント・コーンを用いて予め定義された階層を強制する双曲的エンタテインメント・ロス(Dual-Hierarchical Entailment Loss)と、強い負のマイニングを伴う識別的アライメント・ロス(Dariminative Alignment Loss)により、意味的に類似した構成の間に大きな測地的距離を確立する。
さらに,双曲幾何学におけるインスタンス認識型クロスモーダル注入を実現するために,双曲的クロスモーダルアテンションを考案した。
3つのベンチマークに対する大規模な改善は、H2emがクローズドワールドとオープンワールドの両方のシナリオにおいて、新たな最先端技術を確立していることを示している。
私たちのコードは解放されます。
関連論文リスト
- Hierarchical Semantic Tree Anchoring for CLIP-Based Class-Incremental Learning [11.82771798674077]
クラスインクリメンタルラーニング(Class-Incremental Learning, CIL)は、モデルが過去の知識を保ちながら、新しいクラスを継続的に学習することを可能にする。
しかし、現実世界の視覚的および言語的概念は本質的に階層的である。
本稿では,CILに階層的な情報を固定し,破滅的な忘れを抑えるHASTENを提案する。
論文 参考訳(メタデータ) (2025-11-19T17:14:47Z) - OpenHype: Hyperbolic Embeddings for Hierarchical Open-Vocabulary Radiance Fields [25.81679730373062]
連続的な双曲型潜在空間を用いてシーン階層を表現する新しい手法であるOpenHypeを提案する。
双曲幾何学の特性を活用することにより、OpenHypeは自然にマルチスケールな関係を符号化する。
提案手法は,標準ベンチマークにおける最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-10-24T13:17:56Z) - CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting [53.15827818829865]
2Dプリンシパルに依存しているメソッドは、横断的なセマンティクスの不整合という重要な課題に陥る。
CCL-LGSは、多視点セマンティックキューを統合することで、ビューに一貫性のあるセマンティック監視を実現する新しいフレームワークである。
我々の枠組みは、カテゴリー識別性を維持しながら意味的対立を明示的に解決する。
論文 参考訳(メタデータ) (2025-05-26T19:09:33Z) - Hierarchical Mamba Meets Hyperbolic Geometry: A New Paradigm for Structured Language Embeddings [1.4183971140167244]
階層型マンバ (HiM) を用いて階層型言語埋め込みを学習する。
HiMは効率的なMamba2と指数関数的な成長と双曲幾何学の曲線の性質を統合している。
両モデルが4つの存在論的データセットの階層的関係を効果的に捉えていることを示す。
論文 参考訳(メタデータ) (2025-05-25T04:45:06Z) - Understanding and Mitigating Hyperbolic Dimensional Collapse in Graph Contrastive Learning [70.0681902472251]
双曲空間における高品質グラフ埋め込みを学習するための新しいコントラスト学習フレームワークを提案する。
具体的には、階層的なデータ不変情報を効果的にキャプチャするアライメントメトリックを設計する。
双曲空間において、木の性質に関連する葉と高さの均一性に対処する必要があることを示す。
論文 参考訳(メタデータ) (2023-10-27T15:31:42Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - Geometry Interaction Knowledge Graph Embeddings [153.69745042757066]
ユークリッド空間,双曲空間,超球空間間の空間構造を対話的に学習する幾何学的相互作用知識グラフ埋め込み(GIE)を提案する。
提案したGIEは、よりリッチなリレーショナル情報、モデルキー推論パターンをキャプチャし、エンティティ間の表現的セマンティックマッチングを可能にする。
論文 参考訳(メタデータ) (2022-06-24T08:33:43Z) - Robust Large-Margin Learning in Hyperbolic Space [64.42251583239347]
ユークリッド空間ではなく双曲型で分類器を学ぶための最初の理論的保証を示す。
本研究では, 対向例の慎重な注入に頼って, 大面積超平面を効率よく学習するアルゴリズムを提案する。
双曲空間によく埋め込まれる階層的データに対して、低埋め込み次元は優れた保証を保証することを証明している。
論文 参考訳(メタデータ) (2020-04-11T19:11:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。