論文の概要: Data-driven Coreference-based Ontology Building
- arxiv url: http://arxiv.org/abs/2410.17051v1
- Date: Tue, 22 Oct 2024 14:30:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:25:40.131886
- Title: Data-driven Coreference-based Ontology Building
- Title(参考訳): データ駆動型コアベースオントロジービルディング
- Authors: Shir Ashury-Tahan, Amir David Nissan Cohen, Nadav Cohen, Yoram Louzoun, Yoav Goldberg,
- Abstract要約: 参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
- 参考スコア(独自算出の注目度): 48.995395445597225
- License:
- Abstract: While coreference resolution is traditionally used as a component in individual document understanding, in this work we take a more global view and explore what can we learn about a domain from the set of all document-level coreference relations that are present in a large corpus. We derive coreference chains from a corpus of 30 million biomedical abstracts and construct a graph based on the string phrases within these chains, establishing connections between phrases if they co-occur within the same coreference chain. We then use the graph structure and the betweeness centrality measure to distinguish between edges denoting hierarchy, identity and noise, assign directionality to edges denoting hierarchy, and split nodes (strings) that correspond to multiple distinct concepts. The result is a rich, data-driven ontology over concepts in the biomedical domain, parts of which overlaps significantly with human-authored ontologies. We release the coreference chains and resulting ontology under a creative-commons license, along with the code.
- Abstract(参考訳): コア参照解決は、伝統的に個々の文書理解の構成要素として使われてきたが、この研究では、よりグローバルな視点で、大きなコーパスに存在するすべてのドキュメントレベルのコア参照関係の集合から、ドメインについて何が学べるかを探求する。
我々は、3000万のバイオメディカル抽象体のコーパスからコア参照チェーンを導出し、これらのチェーン内の文字列句に基づいてグラフを構築し、同じコア参照チェーン内で共起した場合にフレーズ間の接続を確立する。
次に、グラフ構造と中間集中度尺度を用いて、階層を表すエッジとアイデンティティとノイズを区別し、階層を示すエッジに方向を割り当て、複数の異なる概念に対応する分割ノード(弦)を割り当てる。
その結果、バイオメディカル領域の概念に関するリッチでデータ駆動のオントロジーが生まれ、その一部が人間によるオントロジーと大きく重なっている。
私たちはコア参照チェーンをリリースし、コードとともにクリエイティブ・コモンズライセンスの下でオントロジーをもたらします。
関連論文リスト
- Unified Lattice Graph Fusion for Chinese Named Entity Recognition [9.863877505377165]
中国語のエンティティ認識のための統一格子グラフ融合(ULGF)手法を提案する。
ノード表現を学習するために反復的にセマンティックな相互作用を実行する複数のグラフベースのイントラソース自己アテンションとソース間相互ゲージ融合層を積み重ねる。
論文 参考訳(メタデータ) (2023-12-28T09:31:25Z) - Coreference Graph Guidance for Mind-Map Generation [5.289044688419791]
近年、最先端の手法が文書の文を逐次エンコードし、シークエンス・トゥ・グラフを介して関係グラフに変換する。
外部構造知識を組み込むためのコア推論誘導マインドマップ生成ネットワーク(CMGN)を提案する。
論文 参考訳(メタデータ) (2023-12-19T09:39:27Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Graphonomy: Universal Image Parsing via Graph Reasoning and Transfer [140.72439827136085]
グラフィノノミー(Graphonomy)というグラフ推論・伝達学習フレームワークを提案する。
人間の知識とラベル分類を、局所畳み込みを超えた中間グラフ表現学習に組み込んでいる。
意味認識グラフの推論と転送を通じて、複数のドメインにおけるグローバルおよび構造化されたセマンティックコヒーレンシーを学習する。
論文 参考訳(メタデータ) (2021-01-26T08:19:03Z) - Joint Semantic Analysis with Document-Level Cross-Task Coherence Rewards [13.753240692520098]
本稿では,共用コア参照解決のためのニューラルネットワークアーキテクチャと,英語のセマンティックロールラベリングについて述べる。
我々は、文書と意味的アノテーション間のグローバルコヒーレンスを促進するために強化学習を使用します。
これにより、異なるドメインからの複数のデータセットにおける両方のタスクが改善される。
論文 参考訳(メタデータ) (2020-10-12T09:36:24Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Heterogeneous Graph Neural Networks for Extractive Document
Summarization [101.17980994606836]
クロス文関係は、抽出文書要約における重要なステップである。
We present a graph-based neural network for extractive summarization (HeterSumGraph)
抽出文書要約のためのグラフベースニューラルネットワークに異なる種類のノードを導入する。
論文 参考訳(メタデータ) (2020-04-26T14:38:11Z) - Bidirectional Graph Reasoning Network for Panoptic Segmentation [126.06251745669107]
本稿では,BGRNet(Bidirectional Graph Reasoning Network)を導入し,前景物と背景物間のモジュラー内およびモジュラー間関係について検討する。
BGRNetはまず、インスタンスとセマンティックセグメンテーションの両方でイメージ固有のグラフを構築し、提案レベルとクラスレベルで柔軟な推論を可能にする。
論文 参考訳(メタデータ) (2020-04-14T02:32:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。