論文の概要: Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks
- arxiv url: http://arxiv.org/abs/2008.13099v4
- Date: Wed, 20 Jan 2021 12:31:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 12:10:07.146243
- Title: Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks
- Title(参考訳): 大規模異種学術ネットワークにおける名前曖昧化のためのペアワイズ学習
- Authors: Qingyun Sun, Hao Peng, Jianxin Li, Senzhang Wang, Xiangyu Dong,
Liangxuan Zhao, Philip S. Yu and Lifang He
- Abstract要約: 本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
- 参考スコア(独自算出の注目度): 81.00481125272098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Name disambiguation aims to identify unique authors with the same name.
Existing name disambiguation methods always exploit author attributes to
enhance disambiguation results. However, some discriminative author attributes
(e.g., email and affiliation) may change because of graduation or job-hopping,
which will result in the separation of the same author's papers in digital
libraries. Although these attributes may change, an author's co-authors and
research topics do not change frequently with time, which means that papers
within a period have similar text and relation information in the academic
network. Inspired by this idea, we introduce Multi-view Attention-based
Pairwise Recurrent Neural Network (MA-PairRNN) to solve the name disambiguation
problem. We divided papers into small blocks based on discriminative author
attributes and blocks of the same author will be merged according to pairwise
classification results of MA-PairRNN. MA-PairRNN combines heterogeneous graph
embedding learning and pairwise similarity learning into a framework. In
addition to attribute and structure information, MA-PairRNN also exploits
semantic information by meta-path and generates node representation in an
inductive way, which is scalable to large graphs. Furthermore, a semantic-level
attention mechanism is adopted to fuse multiple meta-path based
representations. A Pseudo-Siamese network consisting of two RNNs takes two
paper sequences in publication time order as input and outputs their
similarity. Results on two real-world datasets demonstrate that our framework
has a significant and consistent improvement of performance on the name
disambiguation task. It was also demonstrated that MA-PairRNN can perform well
with a small amount of training data and have better generalization ability
across different research areas.
- Abstract(参考訳): 名前の曖昧さは、同じ名前の作家を識別することを目的としている。
既存の名前曖昧化メソッドは常に著者属性を利用して曖昧化結果を強化する。
しかし、いくつかの差別的な著者属性(例えば電子メールやアフィリエイト)は卒業や仕事のホッピングのために変化し、デジタル図書館で同じ著者の論文が分離される。
これらの属性は変化するかもしれないが、著者の共著者や研究テーマは時間とともに頻繁には変化しない。
このアイデアに触発されて、多視点注意に基づくペアワイドリカレントニューラルネットワーク(MA-PairRNN)を導入し、名前の曖昧さを解決する。
論文を識別的著者属性に基づいて小さなブロックに分割し,ma-pairrnnのペアワイズ分類結果に従って同一著者のブロックをマージする。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
属性情報や構造情報に加えて、MA-PairRNNはメタパスによる意味情報も活用し、大きなグラフにスケーラブルなインダクティブなノード表現を生成する。
さらに、複数のメタパスに基づく表現を融合させる意味レベルアテンション機構が採用されている。
2つのrnnからなる疑似シャムネットワークは、出版時間順に2つの文書シーケンスを入力として、それらの類似性を出力する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
また、MA-PairRNNは、少量のトレーニングデータで良好に動作し、異なる研究領域にまたがるより優れた一般化能力を有することを示した。
関連論文リスト
- A Generative Approach for Wikipedia-Scale Visual Entity Recognition [56.55633052479446]
与えられたクエリ画像をWikipediaにある600万の既存エンティティの1つにマッピングするタスクに対処する。
本稿では,対象エンティティを識別する「意味的・識別的コード」の自動復号化を学習する,新しい生成エンティティ認識フレームワークを紹介する。
論文 参考訳(メタデータ) (2024-03-04T13:47:30Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Author Name Disambiguation via Heterogeneous Network Embedding from
Structural and Semantic Perspectives [13.266320447769564]
名前の曖昧さは、複数の著者が同じ名前を持つなど、学術的なデジタル図書館で一般的である。
提案手法は主に異種ネットワークとクラスタリングのための表現学習に基づいている。
意味表現はNLPツールを使用して生成される。
論文 参考訳(メタデータ) (2022-12-24T11:22:34Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - NameRec*: Highly Accurate and Fine-grained Person Name Recognition [11.43547342030705]
NameRec*タスクは、高精度できめ細やかな人名認識を目指します。
CogNNは、文内のコンテキストと名前形式の豊富なトレーニング信号を完全に探索します。
IsBERTは、重なり合う入力プロセッサと、双方向に重なり合うコンテキスト埋め込み学習を備えた文間エンコーダを備える。
論文 参考訳(メタデータ) (2021-03-21T10:35:04Z) - Effect of forename string on author name disambiguation [8.160343645537106]
著者のフォアネームは、どの名前のインスタンスがあいまいか、どれが同じ著者を指す可能性が高いかを決定するために使用される。
本研究は,複数のラベル付きデータセットを用いた著者名不明瞭化における名前の貢献度を評価する。
論文 参考訳(メタデータ) (2021-02-05T15:54:11Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Joint Semantic Analysis with Document-Level Cross-Task Coherence Rewards [13.753240692520098]
本稿では,共用コア参照解決のためのニューラルネットワークアーキテクチャと,英語のセマンティックロールラベリングについて述べる。
我々は、文書と意味的アノテーション間のグローバルコヒーレンスを促進するために強化学習を使用します。
これにより、異なるドメインからの複数のデータセットにおける両方のタスクが改善される。
論文 参考訳(メタデータ) (2020-10-12T09:36:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。