論文の概要: Classifying Wikipedia in a fine-grained hierarchy: what graphs can
contribute
- arxiv url: http://arxiv.org/abs/2001.07558v2
- Date: Wed, 22 Jan 2020 08:24:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 23:35:58.589631
- Title: Classifying Wikipedia in a fine-grained hierarchy: what graphs can
contribute
- Title(参考訳): Wikipediaをきめ細かい階層で分類する:グラフが貢献できるもの
- Authors: Tiphaine Viard, Thomas McLachlan, Hamidreza Ghader, Satoshi Sekine
- Abstract要約: 我々は、ウィキペディアを細かな名前付きエンティティオントロジー(NE)に分類するために、グラフ(構造)情報を統合するタスクに対処する。
日本語ウィキペディアから抽出した22,000ページのサブセットを手作業でラベル付けして,大規模な実践実験を行う。
この結果から,グラフ情報の統合は,入力特徴空間の空白度を低減することに成功し,従来の作業と同等かそれ以上の分類結果が得られることがわかった。
- 参考スコア(独自算出の注目度): 0.5530212768657543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wikipedia is a huge opportunity for machine learning, being the largest
semi-structured base of knowledge available. Because of this, many works
examine its contents, and focus on structuring it in order to make it usable in
learning tasks, for example by classifying it into an ontology. Beyond its
textual contents, Wikipedia also displays a typical graph structure, where
pages are linked together through citations. In this paper, we address the task
of integrating graph (i.e. structure) information to classify Wikipedia into a
fine-grained named entity ontology (NE), the Extended Named Entity hierarchy.
To address this task, we first start by assessing the relevance of the graph
structure for NE classification. We then explore two directions, one related to
feature vectors using graph descriptors commonly used in large-scale network
analysis, and one extending flat classification to a weighted model taking into
account semantic similarity. We conduct at-scale practical experiments, on a
manually labeled subset of 22,000 pages extracted from the Japanese Wikipedia.
Our results show that integrating graph information succeeds at reducing
sparsity of the input feature space, and yields classification results that are
comparable or better than previous works.
- Abstract(参考訳): wikipediaは機械学習にとって大きな機会であり、利用可能な知識の最も大きな半構造化ベースである。
そのため、その内容を調べ、学習課題に利用するために、例えばオントロジーに分類して構成することに集中する作品が多い。
テキストの内容以外にも、Wikipediaには典型的なグラフ構造があり、ページは引用を通じてリンクされる。
本稿では,ウィキペディアを細かな名前付きエンティティオントロジー(NE)、拡張名前付きエンティティ階層に分類するために,グラフ情報(構造)を統合するタスクに対処する。
この課題に対処するため、まず、ne分類のグラフ構造との関連性を評価することから始める。
次に,大規模ネットワーク解析によく用いられるグラフ記述子を用いた特徴ベクトルと,意味的類似性を考慮した重み付きモデルへのフラットな分類の2つの方向を探索する。
日本語版ウィキペディアから抽出した22,000ページを手作業でラベル付けして,実演実験を行った。
その結果,グラフ情報の統合は,入力特徴空間のスパース性を低減することに成功し,従来と同等かそれ以上の分類結果が得られることがわかった。
関連論文リスト
- Coreference Graph Guidance for Mind-Map Generation [5.289044688419791]
近年、最先端の手法が文書の文を逐次エンコードし、シークエンス・トゥ・グラフを介して関係グラフに変換する。
外部構造知識を組み込むためのコア推論誘導マインドマップ生成ネットワーク(CMGN)を提案する。
論文 参考訳(メタデータ) (2023-12-19T09:39:27Z) - Graph Few-shot Learning with Task-specific Structures [38.52226241144403]
既存のグラフ数ショット学習手法は一般的にグラフニューラルネットワーク(GNN)を利用する
メタタスクごとにタスク固有の構造を学習する新しいフレームワークを提案する。
このようにして、各メタタスクに適したタスク固有の構造を持つノード表現を学習することができる。
論文 参考訳(メタデータ) (2022-10-21T17:40:21Z) - Joint Language Semantic and Structure Embedding for Knowledge Graph
Completion [66.15933600765835]
本稿では,知識三重項の自然言語記述と構造情報とを共同で組み込むことを提案する。
本手法は,学習済み言語モデルを微調整することで,完了作業のための知識グラフを埋め込む。
各種知識グラフベンチマーク実験により,本手法の最先端性能を実証した。
論文 参考訳(メタデータ) (2022-09-19T02:41:02Z) - Semi-Supervised Hierarchical Graph Classification [54.25165160435073]
ノードがグラフのインスタンスである階層グラフにおけるノード分類問題について検討する。
本稿では階層グラフ相互情報(HGMI)を提案し,理論的保証をもってHGMIを計算する方法を提案する。
本稿では,この階層グラフモデリングとSEAL-CI法がテキストおよびソーシャルネットワークデータに与える影響を実証する。
論文 参考訳(メタデータ) (2022-06-11T04:05:29Z) - One-shot Scene Graph Generation [130.57405850346836]
ワンショットシーングラフ生成タスクに対して,複数の構造化知識(関係知識知識)を提案する。
提案手法は既存の最先端手法よりも大きなマージンで優れる。
論文 参考訳(メタデータ) (2022-02-22T11:32:59Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - Sparse Structure Learning via Graph Neural Networks for Inductive
Document Classification [2.064612766965483]
帰納的文書分類のための新しいGNNに基づくスパース構造学習モデルを提案する。
本モデルでは,文間の不連続な単語を接続する訓練可能なエッジの集合を収集し,動的文脈依存性を持つエッジを疎結合に選択するために構造学習を用いる。
いくつかの実世界のデータセットの実験では、提案されたモデルがほとんどの最先端の結果より優れていることが示されている。
論文 参考訳(メタデータ) (2021-12-13T02:36:04Z) - SHGNN: Structure-Aware Heterogeneous Graph Neural Network [77.78459918119536]
本稿では、上記の制約に対処する構造対応不均一グラフニューラルネットワーク(SHGNN)を提案する。
まず,メタパス内の中間ノードの局所構造情報を取得するために,特徴伝搬モジュールを利用する。
次に、ツリーアテンションアグリゲータを使用して、グラフ構造情報をメタパス上のアグリゲーションモジュールに組み込む。
最後に、メタパスアグリゲータを利用して、異なるメタパスから集約された情報を融合する。
論文 参考訳(メタデータ) (2021-12-12T14:18:18Z) - Graph Classification Based on Skeleton and Component Features [9.681154082075698]
骨格情報に基づく分類を実現するグラフ埋め込みアルゴリズムGraphCSCを提案する。
2つのグラフは、それらの骨格と成分がどちらも類似している場合に似ており、我々のモデルでは、両方のグラフをグラフの同質性評価として埋め込みに統合する。
我々は、最新の最先端のベースラインの包括的リストと比較して、異なるデータセット上でモデルを実証し、実世界のグラフ分類タスクにおいて、我々の作業が優れていることを示す実験を行った。
論文 参考訳(メタデータ) (2021-02-02T10:52:17Z) - HOSE-Net: Higher Order Structure Embedded Network for Scene Graph
Generation [20.148175528691905]
本稿では,関係の局所的および大域的構造情報を出力空間に組み込むための新しい構造認識型組込み分類器(SEC)モジュールを提案する。
また,高次構造情報を導入して部分空間の数を減らし,階層的セマンティックアグリゲーション(HSA)モジュールを提案する。
提案したHOSE-Netは、Visual GenomeとVRDの2つの人気のあるベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-08-12T07:58:13Z) - Structure-Augmented Text Representation Learning for Efficient Knowledge
Graph Completion [53.31911669146451]
人為的な知識グラフは、様々な自然言語処理タスクに重要な支援情報を提供する。
これらのグラフは通常不完全であり、自動補完を促す。
グラフ埋め込みアプローチ(例えばTransE)は、グラフ要素を密度の高い埋め込みに表現することで構造化された知識を学ぶ。
テキストエンコーディングアプローチ(KG-BERTなど)は、グラフトリプルのテキストとトリプルレベルの文脈化表現を利用する。
論文 参考訳(メタデータ) (2020-04-30T13:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。