論文の概要: Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion
- arxiv url: http://arxiv.org/abs/2104.03682v2
- Date: Sat, 10 Apr 2021 08:14:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 10:34:21.853369
- Title: Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion
- Title(参考訳): 誰が先に行くの?
分類向上のための自己監督型概念ソーティングモデル
- Authors: Xiangchen Song, Jiaming Shen, Jieyu Zhang, and Jiawei Han
- Abstract要約: データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
- 参考スコア(独自算出の注目度): 50.794640012673064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Taxonomies have been widely used in various machine learning and text mining
systems to organize knowledge and facilitate downstream tasks. One critical
challenge is that, as data and business scope grow in real applications,
existing taxonomies need to be expanded to incorporate new concepts. Previous
works on taxonomy expansion process the new concepts independently and
simultaneously, ignoring the potential relationships among them and the
appropriate order of inserting operations. However, in reality, the new
concepts tend to be mutually correlated and form local hypernym-hyponym
structures. In such a scenario, ignoring the dependencies of new concepts and
the order of insertion may trigger error propagation. For example, existing
taxonomy expansion systems may insert hyponyms to existing taxonomies before
their hypernym, leading to sub-optimal expanded taxonomies. To complement
existing taxonomy expansion systems, we propose TaxoOrder, a novel
self-supervised framework that simultaneously discovers the local
hypernym-hyponym structure among new concepts and decides the order of
insertion. TaxoOrder can be directly plugged into any taxonomy expansion system
and improve the quality of expanded taxonomies. Experiments on the real-world
dataset validate the effectiveness of TaxoOrder to enhance taxonomy expansion
systems, leading to better-resulting taxonomies with comparison to baselines
under various evaluation metrics.
- Abstract(参考訳): 分類法は様々な機械学習やテキストマイニングシステムで広く使われ、知識を整理し、下流の作業を容易にする。
重要な課題の1つは、データとビジネスのスコープが実際のアプリケーションで大きくなるにつれて、既存の分類体系を拡大して新しい概念を組み込む必要があることである。
分類の展開過程に関する以前の研究は、新しい概念を独立かつ同時に独立に展開し、それらの間の潜在的な関係と挿入操作の適切な順序を無視した。
しかし、実際には、新しい概念は相互に相関し、局所的なハイパーニム・ハイポニム構造を形成する傾向がある。
このようなシナリオでは、新しい概念の依存関係を無視し、挿入順序がエラー伝搬を引き起こす可能性がある。
例えば、既存の分類学拡張システムは、そのハイパーネムの前に既存の分類学に仮説を挿入する可能性がある。
既存の分類体系を補完するために,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
分類体系は任意の分類体系に直接接続でき、拡張された分類体系の品質を向上させることができる。
実世界のデータセットを用いた実験は、分類学拡張システムを強化するためのTaxoOrderの有効性を検証し、様々な評価基準の下でのベースラインと比較して、より良い分類基準をもたらす。
関連論文リスト
- CodeTaxo: Enhancing Taxonomy Expansion with Limited Examples via Code Language Prompts [40.52605902842168]
textscCodeTaxoは、コード言語プロンプトを通じて大きな言語モデルを活用する新しいアプローチである。
異なるドメインの5つの実世界のベンチマークの実験では、textscCodeTaxoはすべての評価指標に対して一貫して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-08-17T02:15:07Z) - Insert or Attach: Taxonomy Completion via Box Embedding [75.69894194912595]
以前のアプローチでは、ユークリッド空間のベクトルとして概念を組み込んでおり、分類学における非対称関係をモデル化することは困難である。
ボックス内埋め込み空間内に2つの特殊な幾何学的スコアラを設計するために,ボックス封じ込めと中心クローズネスを活用するフレームワークであるTaxBoxを開発した。
これらのスコアラーは挿入操作とアタッチメント操作用に調整されており、概念間の本質的な関係を効果的に捉えることができる。
論文 参考訳(メタデータ) (2023-05-18T14:34:58Z) - Learning What You Need from What You Did: Product Taxonomy Expansion
with User Behaviors Supervision [21.649258076884927]
我々は,既存の分類学に新たな概念を付加するための,自己監督的かつユーザ行動指向の製品拡張フレームワークを提案する。
本フレームワークは,ユーザの意図や認識に合致した偽名関係を抽出する。
本手法は実世界の製品のサイズを88%のセマンティック精度で39,263から94,698に拡大する。
論文 参考訳(メタデータ) (2022-03-28T17:17:50Z) - TaxoEnrich: Self-Supervised Taxonomy Completion via Structure-Semantic
Representations [28.65753036636082]
本稿では,既存の分類学における意味的特徴と構造的情報の両方を効果的に活用する新しい分類学補完フレームワークを提案する。
分類エンリッチは,(1)概念の意味的意味と分類学的関係を,強力な事前学習言語モデルに基づいて組み込んだ分類記述型埋め込み,(2)分類の構造情報を符号化して候補位置表現を学習する分類認識シーケンシャルエンコーダの4つの構成要素から構成される。
異なるドメインからの4つの大規模な実世界のデータセットの実験は、TaxoEnrichがすべての評価指標の中で最高のパフォーマンスを達成し、過去の最先端よりも大きなマージンでパフォーマンスを向上していることを示している。
論文 参考訳(メタデータ) (2022-02-10T08:10:43Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - STEAM: Self-Supervised Taxonomy Expansion with Mini-Paths [53.45704816829921]
本稿では,STEAMという自己管理型分類拡張モデルを提案する。
STEAMは自然の自己超越信号を生成し、ノードアタッチメント予測タスクを定式化する。
実験の結果、STEAMは11.6%の精度と7.0%の相反ランクで、最先端の分類法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T00:32:53Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。