論文の概要: Deep Author Name Disambiguation using DBLP Data
- arxiv url: http://arxiv.org/abs/2303.10067v1
- Date: Fri, 17 Mar 2023 15:50:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-20 14:08:44.298071
- Title: Deep Author Name Disambiguation using DBLP Data
- Title(参考訳): DBLPデータを用いたDeep Author Name Disambiguation
- Authors: Zeyd Boukhers and Nagaraj Bahubali Asundi
- Abstract要約: 著者名Ambiguity(ANA)は、デジタル図書館において重要なオープン問題と考えられている。
本稿では,著者名と現実の実体をリンクする著者名曖昧化(AND)アプローチを提案する。
- 参考スコア(独自算出の注目度): 7.081604594416337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the academic world, the number of scientists grows every year and so does
the number of authors sharing the same names. Consequently, it challenging to
assign newly published papers to their respective authors. Therefore, Author
Name Ambiguity (ANA) is considered a critical open problem in digital
libraries. This paper proposes an Author Name Disambiguation (AND) approach
that links author names to their real-world entities by leveraging their
co-authors and domain of research. To this end, we use data collected from the
DBLP repository that contains more than 5 million bibliographic records
authored by around 2.6 million co-authors. Our approach first groups authors
who share the same last names and same first name initials. The author within
each group is identified by capturing the relation with his/her co-authors and
area of research, represented by the titles of the validated publications of
the corresponding author. To this end, we train a neural network model that
learns from the representations of the co-authors and titles. We validated the
effectiveness of our approach by conducting extensive experiments on a large
dataset.
- Abstract(参考訳): 学術界では、科学者の数は毎年増え、同じ名前の著者の数が増えている。
そのため、新たに出版された論文をそれぞれの著者に割り当てることは困難である。
したがって、著者名Ambiguity(ANA)はデジタル図書館において重要なオープン問題であると考えられている。
本稿では,共著者と研究領域を活用することで,著者名と現実の実体をリンクする著者名曖昧化(AND)アプローチを提案する。
この目的のために、約260万人の共著者によって書かれた500万以上の書誌記録を含むDBLPリポジトリから収集されたデータを使用する。
我々のアプローチは、同じ名前と同じ名前のイニシャルを共有する著者を最初にグループ化する。
各グループ内の著者は、対応する著者の検証された出版物のタイトルで表される、共同著者および研究領域との関係を捉えて特定される。
この目的のために、共著者とタイトルの表現から学習するニューラルネットワークモデルをトレーニングする。
大規模データセットに対して広範な実験を行い,提案手法の有効性を検証した。
関連論文リスト
- Examining Different Research Communities: Authorship Network [0.0]
コンピュータサイエンスの2つの異なる研究領域、データマイニングとソフトウェアエンジニアリングのためのGoogle Scholarデータを収集しました。
研究者データベースリソースは、ネットワーク分析、データマイニング、著者ネットワークを介して著者間のリンクを特定するために強力である。
論文 参考訳(メタデータ) (2024-08-24T19:04:02Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Cracking Double-Blind Review: Authorship Attribution with Deep Learning [43.483063713471935]
本稿では、匿名の原稿を著者に属性付けるトランスフォーマーベースのニューラルネットワークアーキテクチャを提案する。
我々は、arXivで公開されているすべての研究論文を200万冊以上の原稿に活用する。
本手法は, 論文の最大73%を正解する, 前代未聞の著者帰属精度を実現する。
論文 参考訳(メタデータ) (2022-11-14T15:50:24Z) - A Bayesian Learning, Greedy agglomerative clustering approach and
evaluation techniques for Author Name Disambiguation Problem [0.0]
著者名はしばしば、同じ作者が異なる名前で登場することや、類似した名前を持つ複数の著者によって曖昧さに悩まされる。
私は著者名を曖昧にすることを目的とした研究努力に重点を置いています。
論文 参考訳(メタデータ) (2022-11-01T08:22:53Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Whois? Deep Author Name Disambiguation using Bibliographic Data [7.081604594416337]
著者名Ambiguity(ANA)は、デジタル図書館において重要なオープン問題と考えられている。
本稿では,著者名と現実の実体をリンクする著者名曖昧化(AND)アプローチを提案する。
論文 参考訳(メタデータ) (2022-07-11T11:03:39Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Bib2Auth: Deep Learning Approach for Author Disambiguation using
Bibliographic Data [4.817368273632451]
著者名と現実の実体をリンクする新しい手法を,共著者パターンと研究領域に頼って提案する。
教師付きディープラーニングモデルでは,著者と共著者との関係や研究領域を把握し,著者を識別する。
Bib2Authは比較的大きなデータセットで優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2021-07-09T12:25:11Z) - Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks [81.00481125272098]
本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
論文 参考訳(メタデータ) (2020-08-30T06:08:20Z) - Domain Adaptive Ensemble Learning [141.98192460069765]
両問題に対処するため,ドメイン適応アンサンブル学習(DAEL)という統合フレームワークを提案する。
3つのマルチソースUDAデータセットと2つのDGデータセットの実験により、DAELは両方の問題、しばしば大きなマージンによって、技術の状態を改善することが示された。
論文 参考訳(メタデータ) (2020-03-16T16:54:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。