論文の概要: Taxonomy Enrichment with Text and Graph Vector Representations
- arxiv url: http://arxiv.org/abs/2201.08598v1
- Date: Fri, 21 Jan 2022 09:01:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-24 18:37:09.890490
- Title: Taxonomy Enrichment with Text and Graph Vector Representations
- Title(参考訳): テキストとグラフベクトル表現による分類学の充実
- Authors: Irina Nikishina, Mikhail Tikhomirov, Varvara Logacheva, Yuriy Nazarov,
Alexander Panchenko, Natalia Loukachevitch
- Abstract要約: 我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
- 参考スコア(独自算出の注目度): 61.814256012166794
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge graphs such as DBpedia, Freebase or Wikidata always contain a
taxonomic backbone that allows the arrangement and structuring of various
concepts in accordance with the hypo-hypernym ("class-subclass") relationship.
With the rapid growth of lexical resources for specific domains, the problem of
automatic extension of the existing knowledge bases with new words is becoming
more and more widespread. In this paper, we address the problem of taxonomy
enrichment which aims at adding new words to the existing taxonomy.
We present a new method that allows achieving high results on this task with
little effort. It uses the resources which exist for the majority of languages,
making the method universal. We extend our method by incorporating deep
representations of graph structures like node2vec, Poincar\'e embeddings, GCN
etc. that have recently demonstrated promising results on various NLP tasks.
Furthermore, combining these representations with word embeddings allows us to
beat the state of the art.
We conduct a comprehensive study of the existing approaches to taxonomy
enrichment based on word and graph vector representations and their fusion
approaches. We also explore the ways of using deep learning architectures to
extend the taxonomic backbones of knowledge graphs. We create a number of
datasets for taxonomy extension for English and Russian. We achieve
state-of-the-art results across different datasets and provide an in-depth
error analysis of mistakes.
- Abstract(参考訳): dbpedia、freebase、wikidataのような知識グラフは、常に分類学的なバックボーンを含んでおり、hypo-hypernym(クラス-サブクラス)の関係に従って様々な概念の配置と構造化を可能にする。
特定のドメインに対する語彙資源の急速な増加に伴い、既存の知識ベースを新しい単語で自動的に拡張する問題はますます広くなってきている。
本稿では,既存の分類学に新たな単語を追加することを目的とした分類学の富化問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
大部分の言語に存在しているリソースを使用し、メソッドを普遍化する。
我々は,最近NLPタスクにおいて有望な結果を示した node2vec, Poincar\'e 埋め込み, GCN などのグラフ構造の深部表現を組み込むことにより,提案手法を拡張した。
さらに、これらの表現と単語の埋め込みを組み合わせることで、アートの状態を破ることができます。
我々は,単語とグラフのベクトル表現とそれらの融合手法に基づいて,既存の分類の豊かさに対するアプローチを包括的に研究する。
また、ディープラーニングアーキテクチャを用いて知識グラフの分類学的バックボーンを拡張する方法についても検討する。
英語とロシア語の分類拡張のためのデータセットを多数作成します。
異なるデータセットにまたがって最新の結果を達成し、ミスの詳細なエラー解析を提供する。
関連論文リスト
- CodeTaxo: Enhancing Taxonomy Expansion with Limited Examples via Code Language Prompts [40.52605902842168]
textscCodeTaxoは、コード言語プロンプトを通じて大きな言語モデルを活用する新しいアプローチである。
異なるドメインの5つの実世界のベンチマークの実験では、textscCodeTaxoはすべての評価指標に対して一貫して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-08-17T02:15:07Z) - Semantic Enhanced Knowledge Graph for Large-Scale Zero-Shot Learning [74.6485604326913]
我々は、専門知識とカテゴリ意味相関の両方を含む新しい意味強化知識グラフを提供する。
知識グラフの情報伝達のために,Residual Graph Convolutional Network (ResGCN)を提案する。
大規模画像Net-21KデータセットとAWA2データセットを用いた実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-12-26T13:18:36Z) - Joint Language Semantic and Structure Embedding for Knowledge Graph
Completion [66.15933600765835]
本稿では,知識三重項の自然言語記述と構造情報とを共同で組み込むことを提案する。
本手法は,学習済み言語モデルを微調整することで,完了作業のための知識グラフを埋め込む。
各種知識グラフベンチマーク実験により,本手法の最先端性能を実証した。
論文 参考訳(メタデータ) (2022-09-19T02:41:02Z) - Sparse Structure Learning via Graph Neural Networks for Inductive
Document Classification [2.064612766965483]
帰納的文書分類のための新しいGNNに基づくスパース構造学習モデルを提案する。
本モデルでは,文間の不連続な単語を接続する訓練可能なエッジの集合を収集し,動的文脈依存性を持つエッジを疎結合に選択するために構造学習を用いる。
いくつかの実世界のデータセットの実験では、提案されたモデルがほとんどの最先端の結果より優れていることが示されている。
論文 参考訳(メタデータ) (2021-12-13T02:36:04Z) - Enhancing Taxonomy Completion with Concept Generation via Fusing
Relational Representations [41.629471011165684]
既存の分類の展開や完成法は、新しい概念が正確に抽出され、それらの埋め込みベクトルがテキストコーパスから学習されたと仮定する。
我々は,新しい概念を必要とする位置を特定し,適切な概念名を生成することにより,分類の強化を図るためにGenTaxoを提案する。
GenTaxoは、概念埋め込みのためにコーパスに頼る代わりに、周囲のグラフベースおよび言語ベースの情報からコンテキスト埋め込みを学び、概念名ジェネレータを事前トレーニングするためにコーパスを利用する。
論文 参考訳(メタデータ) (2021-06-05T21:50:13Z) - Entity Context Graph: Learning Entity Representations
fromSemi-Structured Textual Sources on the Web [44.92858943475407]
エンティティ中心のテキスト知識ソースを処理してエンティティ埋め込みを学ぶアプローチを提案する。
私たちのアプローチから学んだ埋め込みは、(i)高品質で、既知の知識グラフベースの埋め込みに匹敵し、それらをさらに改善するために使用することができます。
論文 参考訳(メタデータ) (2021-03-29T20:52:14Z) - Graphonomy: Universal Image Parsing via Graph Reasoning and Transfer [140.72439827136085]
グラフィノノミー(Graphonomy)というグラフ推論・伝達学習フレームワークを提案する。
人間の知識とラベル分類を、局所畳み込みを超えた中間グラフ表現学習に組み込んでいる。
意味認識グラフの推論と転送を通じて、複数のドメインにおけるグローバルおよび構造化されたセマンティックコヒーレンシーを学習する。
論文 参考訳(メタデータ) (2021-01-26T08:19:03Z) - Studying Taxonomy Enrichment on Diachronic WordNet Versions [70.27072729280528]
本稿では,資源の乏しい環境での分類拡張の可能性について検討し,多数の言語に適用可能な手法を提案する。
我々は、分類の豊かさを訓練し評価するための新しい英語とロシア語のデータセットを作成し、他の言語のためのそのようなデータセットを作成する技術を記述する。
論文 参考訳(メタデータ) (2020-11-23T16:49:37Z) - Exploiting Structured Knowledge in Text via Graph-Guided Representation
Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。
エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。
既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文 参考訳(メタデータ) (2020-04-29T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。