論文の概要: TaxoBell: Gaussian Box Embeddings for Self-Supervised Taxonomy Expansion
- arxiv url: http://arxiv.org/abs/2601.09633v1
- Date: Wed, 14 Jan 2026 17:08:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.480922
- Title: TaxoBell: Gaussian Box Embeddings for Self-Supervised Taxonomy Expansion
- Title(参考訳): TaxoBell: 自己監督型タコノミー拡張のためのガウシアンボックス埋め込み
- Authors: Sahil Mishra, Srinitish Srinivasan, Srikanta Bedathur, Tanmoy Chakraborty,
- Abstract要約: 分類学は様々な領域にまたがる構造化知識表現のバックボーンを形成する。
既存の自動手法は点ベースのベクトル埋め込みに依存している。
Boxの埋め込みは、封じ込めと不整合を可能にすることで、有望な代替手段を提供する。
- 参考スコア(独自算出の注目度): 25.5809347473818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Taxonomies form the backbone of structured knowledge representation across diverse domains, enabling applications such as e-commerce catalogs, semantic search, and biomedical discovery. Yet, manual taxonomy expansion is labor-intensive and cannot keep pace with the emergence of new concepts. Existing automated methods rely on point-based vector embeddings, which model symmetric similarity and thus struggle with the asymmetric "is-a" relationships that are fundamental to taxonomies. Box embeddings offer a promising alternative by enabling containment and disjointness, but they face key issues: (i) unstable gradients at the intersection boundaries, (ii) no notion of semantic uncertainty, and (iii) limited capacity to represent polysemy or ambiguity. We address these shortcomings with TaxoBell, a Gaussian box embedding framework that translates between box geometries and multivariate Gaussian distributions, where means encode semantic location and covariances encode uncertainty. Energy-based optimization yields stable optimization, robust modeling of ambiguous concepts, and interpretable hierarchical reasoning. Extensive experimentation on five benchmark datasets demonstrates that TaxoBell significantly outperforms eight state-of-the-art taxonomy expansion baselines by 19% in MRR and around 25% in Recall@k. We further demonstrate the advantages and pitfalls of TaxoBell with error analysis and ablation studies.
- Abstract(参考訳): 分類学は、さまざまなドメインにまたがる構造化知識表現のバックボーンを形成し、eコマースカタログ、セマンティックサーチ、生物医学的発見などの応用を可能にしている。
しかし、手動の分類学拡張は労働集約的であり、新しい概念の出現に追随することができない。
既存の自動手法は、対称類似性をモデル化し、分類学の基本となる非対称な「is-a」関係に苦慮する点ベースのベクトル埋め込みに依存している。
Boxの埋め込みは、封じ込めと不一致を可能にすることで、有望な代替手段を提供するが、それらは重要な問題に直面している。
(i) 交差境界における不安定な勾配。
(二)意味的不確実性の概念がなく、
(三)多義性又は曖昧性を表す能力に限界があること。
ボックスジオメトリと多変量ガウス分布を変換するガウスボックス埋め込みフレームワークであるTaxoBellでは,意味的位置と共分散を符号化して不確実性を符号化する。
エネルギーベースの最適化は、安定な最適化、曖昧な概念の堅牢なモデリング、解釈可能な階層的推論をもたらす。
5つのベンチマークデータセットの大規模な実験によると、TaxoBellは8つの最先端の分類学拡張ベースラインをMRRで19%、Recall@kで約25%上回っている。
さらに,TaxoBellの誤り解析とアブレーション研究によるメリットと落とし穴について述べる。
関連論文リスト
- QuanTaxo: A Quantum Approach to Self-Supervised Taxonomy Expansion [17.865428778692557]
分類学拡張のための革新的な量子インスパイアされたフレームワークであるQuanTaxoを紹介する。
QuanTaxo は古典的な埋め込みモデルよりも優れていることを示す。
また,広範囲なアブレーションとケーススタディを通じてQuanTaxoの優位性を強調した。
論文 参考訳(メタデータ) (2025-01-23T18:40:02Z) - Tackling Ambiguity from Perspective of Uncertainty Inference and Affinity Diversification for Weakly Supervised Semantic Segmentation [12.308473939796945]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセグメンテーション(WSSS)は、退屈なアノテーションを使わずに高密度なタスクを実現することを目的としている。
WSSSの性能、特にクラス活性化マップ(CAM)の生成と擬似マスクの精製の段階では、あいまいさに悩まされている。
統一された単一ステージWSSSフレームワークであるUniAを提案し、不確実性推論と親和性多様化の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2024-04-12T01:54:59Z) - Exploiting hidden structures in non-convex games for convergence to Nash
equilibrium [62.88214569402201]
現代の機械学習アプリケーションは、非協調的なナッシュリリアとして定式化することができる。
決定論的環境と決定論的環境の両方に明確な収束保証を提供する。
論文 参考訳(メタデータ) (2023-12-27T15:21:25Z) - Insert or Attach: Taxonomy Completion via Box Embedding [75.69894194912595]
以前のアプローチでは、ユークリッド空間のベクトルとして概念を組み込んでおり、分類学における非対称関係をモデル化することは困難である。
ボックス内埋め込み空間内に2つの特殊な幾何学的スコアラを設計するために,ボックス封じ込めと中心クローズネスを活用するフレームワークであるTaxBoxを開発した。
これらのスコアラーは挿入操作とアタッチメント操作用に調整されており、概念間の本質的な関係を効果的に捉えることができる。
論文 参考訳(メタデータ) (2023-05-18T14:34:58Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - STEAM: Self-Supervised Taxonomy Expansion with Mini-Paths [53.45704816829921]
本稿では,STEAMという自己管理型分類拡張モデルを提案する。
STEAMは自然の自己超越信号を生成し、ノードアタッチメント予測タスクを定式化する。
実験の結果、STEAMは11.6%の精度と7.0%の相反ランクで、最先端の分類法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T00:32:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。