論文の概要: TaxoBell: Gaussian Box Embeddings for Self-Supervised Taxonomy Expansion
- arxiv url: http://arxiv.org/abs/2601.09633v1
- Date: Wed, 14 Jan 2026 17:08:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.480922
- Title: TaxoBell: Gaussian Box Embeddings for Self-Supervised Taxonomy Expansion
- Title(参考訳): TaxoBell: 自己監督型タコノミー拡張のためのガウシアンボックス埋め込み
- Authors: Sahil Mishra, Srinitish Srinivasan, Srikanta Bedathur, Tanmoy Chakraborty,
- Abstract要約: 分類学は様々な領域にまたがる構造化知識表現のバックボーンを形成する。
既存の自動手法は点ベースのベクトル埋め込みに依存している。
Boxの埋め込みは、封じ込めと不整合を可能にすることで、有望な代替手段を提供する。
- 参考スコア(独自算出の注目度): 25.5809347473818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Taxonomies form the backbone of structured knowledge representation across diverse domains, enabling applications such as e-commerce catalogs, semantic search, and biomedical discovery. Yet, manual taxonomy expansion is labor-intensive and cannot keep pace with the emergence of new concepts. Existing automated methods rely on point-based vector embeddings, which model symmetric similarity and thus struggle with the asymmetric "is-a" relationships that are fundamental to taxonomies. Box embeddings offer a promising alternative by enabling containment and disjointness, but they face key issues: (i) unstable gradients at the intersection boundaries, (ii) no notion of semantic uncertainty, and (iii) limited capacity to represent polysemy or ambiguity. We address these shortcomings with TaxoBell, a Gaussian box embedding framework that translates between box geometries and multivariate Gaussian distributions, where means encode semantic location and covariances encode uncertainty. Energy-based optimization yields stable optimization, robust modeling of ambiguous concepts, and interpretable hierarchical reasoning. Extensive experimentation on five benchmark datasets demonstrates that TaxoBell significantly outperforms eight state-of-the-art taxonomy expansion baselines by 19% in MRR and around 25% in Recall@k. We further demonstrate the advantages and pitfalls of TaxoBell with error analysis and ablation studies.
- Abstract(参考訳): 分類学は、さまざまなドメインにまたがる構造化知識表現のバックボーンを形成し、eコマースカタログ、セマンティックサーチ、生物医学的発見などの応用を可能にしている。
しかし、手動の分類学拡張は労働集約的であり、新しい概念の出現に追随することができない。
既存の自動手法は、対称類似性をモデル化し、分類学の基本となる非対称な「is-a」関係に苦慮する点ベースのベクトル埋め込みに依存している。
Boxの埋め込みは、封じ込めと不一致を可能にすることで、有望な代替手段を提供するが、それらは重要な問題に直面している。
(i) 交差境界における不安定な勾配。
(二)意味的不確実性の概念がなく、
(三)多義性又は曖昧性を表す能力に限界があること。
ボックスジオメトリと多変量ガウス分布を変換するガウスボックス埋め込みフレームワークであるTaxoBellでは,意味的位置と共分散を符号化して不確実性を符号化する。
エネルギーベースの最適化は、安定な最適化、曖昧な概念の堅牢なモデリング、解釈可能な階層的推論をもたらす。
5つのベンチマークデータセットの大規模な実験によると、TaxoBellは8つの最先端の分類学拡張ベースラインをMRRで19%、Recall@kで約25%上回っている。
さらに,TaxoBellの誤り解析とアブレーション研究によるメリットと落とし穴について述べる。
関連論文リスト
- Transforming Expert Knowledge into Scalable Ontology via Large Language Models [0.0]
従来の分類学的アライメントへのアプローチは、概念ペアのエキスパートレビューに依存している。
本稿では,大規模言語モデル(LLM)とエキスパートキャリブレーション,反復的プロンプト最適化を組み合わせた新しいフレームワークを提案する。
F1スコアは0.97で、人間のベンチマーク0.68をほぼ上回りました。
論文 参考訳(メタデータ) (2025-06-10T03:48:26Z) - QuanTaxo: A Quantum Approach to Self-Supervised Taxonomy Expansion [17.865428778692557]
分類学拡張のための革新的な量子インスパイアされたフレームワークであるQuanTaxoを紹介する。
QuanTaxo は古典的な埋め込みモデルよりも優れていることを示す。
また,広範囲なアブレーションとケーススタディを通じてQuanTaxoの優位性を強調した。
論文 参考訳(メタデータ) (2025-01-23T18:40:02Z) - Tackling Ambiguity from Perspective of Uncertainty Inference and Affinity Diversification for Weakly Supervised Semantic Segmentation [12.308473939796945]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセグメンテーション(WSSS)は、退屈なアノテーションを使わずに高密度なタスクを実現することを目的としている。
WSSSの性能、特にクラス活性化マップ(CAM)の生成と擬似マスクの精製の段階では、あいまいさに悩まされている。
統一された単一ステージWSSSフレームワークであるUniAを提案し、不確実性推論と親和性多様化の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2024-04-12T01:54:59Z) - Exploiting hidden structures in non-convex games for convergence to Nash
equilibrium [62.88214569402201]
現代の機械学習アプリケーションは、非協調的なナッシュリリアとして定式化することができる。
決定論的環境と決定論的環境の両方に明確な収束保証を提供する。
論文 参考訳(メタデータ) (2023-12-27T15:21:25Z) - Insert or Attach: Taxonomy Completion via Box Embedding [75.69894194912595]
以前のアプローチでは、ユークリッド空間のベクトルとして概念を組み込んでおり、分類学における非対称関係をモデル化することは困難である。
ボックス内埋め込み空間内に2つの特殊な幾何学的スコアラを設計するために,ボックス封じ込めと中心クローズネスを活用するフレームワークであるTaxBoxを開発した。
これらのスコアラーは挿入操作とアタッチメント操作用に調整されており、概念間の本質的な関係を効果的に捉えることができる。
論文 参考訳(メタデータ) (2023-05-18T14:34:58Z) - Bringing motion taxonomies to continuous domains via GPLVM on hyperbolic manifolds [8.385386712928785]
人間の動きは、人間の動きと環境との相互作用の仕方を分類する高レベルの階層的抽象化として機能する。
本稿では,関連する階層構造を捉えるハイパーボリック埋め込みを用いて分類データをモデル化することを提案する。
本モデルでは,既存の分類群や新分類群の未確認データを適切にエンコードし,EuclideanおよびVAEベースの分類群よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-04T15:19:24Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z) - STEAM: Self-Supervised Taxonomy Expansion with Mini-Paths [53.45704816829921]
本稿では,STEAMという自己管理型分類拡張モデルを提案する。
STEAMは自然の自己超越信号を生成し、ノードアタッチメント予測タスクを定式化する。
実験の結果、STEAMは11.6%の精度と7.0%の相反ランクで、最先端の分類法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T00:32:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。