論文の概要: Author Name Disambiguation via Heterogeneous Network Embedding from
Structural and Semantic Perspectives
- arxiv url: http://arxiv.org/abs/2212.12715v1
- Date: Sat, 24 Dec 2022 11:22:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 15:26:42.833726
- Title: Author Name Disambiguation via Heterogeneous Network Embedding from
Structural and Semantic Perspectives
- Title(参考訳): 構造的・意味的視点による異種ネットワーク埋め込みによる著者名曖昧化
- Authors: Wenjin Xie, Siyuan Liu, Xiaomeng Wang, Tao Jia
- Abstract要約: 名前の曖昧さは、複数の著者が同じ名前を持つなど、学術的なデジタル図書館で一般的である。
提案手法は主に異種ネットワークとクラスタリングのための表現学習に基づいている。
意味表現はNLPツールを使用して生成される。
- 参考スコア(独自算出の注目度): 13.266320447769564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Name ambiguity is common in academic digital libraries, such as multiple
authors having the same name. This creates challenges for academic data
management and analysis, thus name disambiguation becomes necessary. The
procedure of name disambiguation is to divide publications with the same name
into different groups, each group belonging to a unique author. A large amount
of attribute information in publications makes traditional methods fall into
the quagmire of feature selection. These methods always select attributes
artificially and equally, which usually causes a negative impact on accuracy.
The proposed method is mainly based on representation learning for
heterogeneous networks and clustering and exploits the self-attention
technology to solve the problem. The presentation of publications is a
synthesis of structural and semantic representations. The structural
representation is obtained by meta-path-based sampling and a skip-gram-based
embedding method, and meta-path level attention is introduced to automatically
learn the weight of each feature. The semantic representation is generated
using NLP tools. Our proposal performs better in terms of name disambiguation
accuracy compared with baselines and the ablation experiments demonstrate the
improvement by feature selection and the meta-path level attention in our
method. The experimental results show the superiority of our new method for
capturing the most attributes from publications and reducing the impact of
redundant information.
- Abstract(参考訳): 名前の曖昧さは、同じ名前の複数の著者など、学術的なデジタル図書館でよく見られる。
これにより、学術データ管理と分析の課題が生じ、名前の曖昧さが要求される。
名前の曖昧さの手順は、同じ名前の出版物を異なるグループに分け、それぞれ独自の著者に属している。
出版物における多くの属性情報により、伝統的手法は特徴選択の四分の一に該当する。
これらの方法は、常に人為的かつ等しく属性を選択し、通常は精度に悪影響を及ぼす。
提案手法は主に異種ネットワークとクラスタリングの表現学習に基づいており,自己認識技術を利用して問題を解決する。
出版物の提示は構造表現と意味表現の合成である。
メタパスに基づくサンプリングとスキップグラムに基づく埋め込み法により構造表現を求め、メタパスレベルの注意を導入し、各特徴の重みを自動的に学習する。
意味表現はNLPツールを使用して生成される。
提案手法は,ベースラインと比較して名前の曖昧さの精度が向上し,特徴選択による改善とメタパスレベルの注意力を示す。
実験の結果,出版物から属性を抽出し,冗長な情報の影響を低減できる新しい手法の優位性を示した。
関連論文リスト
- From Open-Vocabulary to Vocabulary-Free Semantic Segmentation [78.62232202171919]
オープン語彙セマンティックセグメンテーションにより、モデルはトレーニングデータ以外の新しいオブジェクトカテゴリを識別できる。
現在のアプローチは依然として入力として手動で指定されたクラス名に依存しており、現実世界のアプリケーションに固有のボトルネックを生み出している。
この研究は、定義済みのクラス語彙を必要としない、語彙自由セマンティックパイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-17T15:17:08Z) - AttrSeg: Open-Vocabulary Semantic Segmentation via Attribute
Decomposition-Aggregation [33.25304533086283]
オープンボキャブラリセマンティックセグメンテーションは、推論時に新しいオブジェクトカテゴリをセグメンテーションする必要がある難しいタスクである。
最近の研究では、この課題に対処するために視覚言語による事前訓練が検討されているが、現実的なシナリオでは非現実的な仮定に悩まされている。
本研究は,新しい概念を理解する上で,人間の認知に触発された新しい属性分解集約フレームワークであるAttrSegを提案する。
論文 参考訳(メタデータ) (2023-08-31T19:34:09Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - Effect of forename string on author name disambiguation [8.160343645537106]
著者のフォアネームは、どの名前のインスタンスがあいまいか、どれが同じ著者を指す可能性が高いかを決定するために使用される。
本研究は,複数のラベル付きデータセットを用いた著者名不明瞭化における名前の貢献度を評価する。
論文 参考訳(メタデータ) (2021-02-05T15:54:11Z) - Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks [81.00481125272098]
本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
論文 参考訳(メタデータ) (2020-08-30T06:08:20Z) - Improving Domain-Adapted Sentiment Classification by Deep Adversarial
Mutual Learning [51.742040588834996]
ドメイン適応型感情分類(ドメイン適応型感情分類、Domain-adapted sentiment classification)は、ラベル付きソースドメインでトレーニングを行い、ラベルなしターゲットドメイン上で文書レベルの感情を適切に推測する。
本稿では,2つの特徴抽出器群,ドメイン識別器群,感情分類器群,ラベル探索器群を包含する新たな相互学習手法を提案する。
論文 参考訳(メタデータ) (2020-02-01T01:22:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。