論文の概要: Find Parent then Label Children: A Two-stage Taxonomy Completion Method with Pre-trained Language Model
- arxiv url: http://arxiv.org/abs/2406.17739v1
- Date: Tue, 25 Jun 2024 17:25:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 13:31:24.712377
- Title: Find Parent then Label Children: A Two-stage Taxonomy Completion Method with Pre-trained Language Model
- Title(参考訳): 親と子を見分ける:事前学習型言語モデルを用いた二段階分類法
- Authors: Fei Xia, Yixuan Weng, Shizhu He, Kang Liu, Jun Zhao,
- Abstract要約: 分類の完備化のために,ATTEMPTと呼ばれる2段階の手法を提案する。
親ノードを見つけて子ノードをラベル付けすることで,新しい概念を正しい位置に挿入する。
我々は、ハイパーニム/ハイポニミー認識のための事前訓練された言語モデルを利用する。
- 参考スコア(独自算出の注目度): 46.00652942385366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Taxonomies, which organize domain concepts into hierarchical structures, are crucial for building knowledge systems and downstream applications. As domain knowledge evolves, taxonomies need to be continuously updated to include new concepts. Previous approaches have mainly focused on adding concepts to the leaf nodes of the existing hierarchical tree, which does not fully utilize the taxonomy's knowledge and is unable to update the original taxonomy structure (usually involving non-leaf nodes). In this paper, we propose a two-stage method called ATTEMPT for taxonomy completion. Our method inserts new concepts into the correct position by finding a parent node and labeling child nodes. Specifically, by combining local nodes with prompts to generate natural sentences, we take advantage of pre-trained language models for hypernym/hyponymy recognition. Experimental results on two public datasets (including six domains) show that ATTEMPT performs best on both taxonomy completion and extension tasks, surpassing existing methods.
- Abstract(参考訳): ドメイン概念を階層構造に整理する分類学は、知識システムや下流アプリケーションを構築する上で不可欠である。
ドメイン知識が進化するにつれて、新しい概念を含むように、分類学を継続的に更新する必要がある。
従来のアプローチは、主に既存の階層樹の葉ノードに概念を追加することに重点を置いており、それは分類学の知識を十分に活用せず、元の分類学構造(通常は非リーフノードを含む)を更新することができない。
本稿では,ATTEMPTと呼ばれる2段階の方法を提案する。
親ノードを見つけて子ノードをラベル付けすることで,新しい概念を正しい位置に挿入する。
具体的には、局所ノードと自然文を生成するプロンプトを組み合わせることで、ハイパーニム・ハイポニミー認識のための事前学習された言語モデルを利用する。
2つのパブリックデータセット(6つのドメインを含む)の実験結果は、ATTEMPTが既存の手法を超越して、分類の完了と拡張のタスクの両方で最善を尽くしていることを示している。
関連論文リスト
- CodeTaxo: Enhancing Taxonomy Expansion with Limited Examples via Code Language Prompts [40.52605902842168]
textscCodeTaxoは、コード言語プロンプトを通じて大きな言語モデルを活用する新しいアプローチである。
異なるドメインの5つの実世界のベンチマークの実験では、textscCodeTaxoはすべての評価指標に対して一貫して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-08-17T02:15:07Z) - TaxoEnrich: Self-Supervised Taxonomy Completion via Structure-Semantic
Representations [28.65753036636082]
本稿では,既存の分類学における意味的特徴と構造的情報の両方を効果的に活用する新しい分類学補完フレームワークを提案する。
分類エンリッチは,(1)概念の意味的意味と分類学的関係を,強力な事前学習言語モデルに基づいて組み込んだ分類記述型埋め込み,(2)分類の構造情報を符号化して候補位置表現を学習する分類認識シーケンシャルエンコーダの4つの構成要素から構成される。
異なるドメインからの4つの大規模な実世界のデータセットの実験は、TaxoEnrichがすべての評価指標の中で最高のパフォーマンスを達成し、過去の最先端よりも大きなマージンでパフォーマンスを向上していることを示している。
論文 参考訳(メタデータ) (2022-02-10T08:10:43Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - CoRel: Seed-Guided Topical Taxonomy Construction by Concept Learning and
Relation Transferring [37.1330815281983]
本稿では,概念名によって記述された種子分類を入力としてコーパスと種分類を取り入れた種誘導型地域分類構築法を提案する。
関係伝達モジュールは、複数の経路に沿ってユーザの興味ある関係を学習し、転送し、種分類構造を幅と深さで拡張する。
概念学習モジュールは、分類学を共同で埋め込むことで、各概念ノードのセマンティクスを豊かにする。
論文 参考訳(メタデータ) (2020-10-13T22:00:31Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。