論文の概要: Bib2Auth: Deep Learning Approach for Author Disambiguation using
Bibliographic Data
- arxiv url: http://arxiv.org/abs/2107.04382v1
- Date: Fri, 9 Jul 2021 12:25:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-12 13:37:56.693281
- Title: Bib2Auth: Deep Learning Approach for Author Disambiguation using
Bibliographic Data
- Title(参考訳): Bib2Auth: 文献データを用いた著者曖昧化のためのディープラーニングアプローチ
- Authors: Zeyd Boukhers, Nagaraj Bahubali, Abinaya Thulsi Chandrasekaran, Adarsh
Anand, Soniya Manchenahalli Gnanendra Prasadand, Sriram Aralappa
- Abstract要約: 著者名と現実の実体をリンクする新しい手法を,共著者パターンと研究領域に頼って提案する。
教師付きディープラーニングモデルでは,著者と共著者との関係や研究領域を把握し,著者を識別する。
Bib2Authは比較的大きなデータセットで優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 4.817368273632451
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Author name ambiguity remains a critical open problem in digital libraries
due to synonymy and homonymy of names. In this paper, we propose a novel
approach to link author names to their real-world entities by relying on their
co-authorship pattern and area of research. Our supervised deep learning model
identifies an author by capturing his/her relationship with his/her co-authors
and area of research, which is represented by the titles and sources of the
target author's publications. These attributes are encoded by their semantic
and symbolic representations. To this end, Bib2Auth uses ~ 22K bibliographic
records from the DBLP repository and is trained with each pair of co-authors.
The extensive experiments have proved the capability of the approach to
distinguish between authors sharing the same name and recognize authors with
different name variations. Bib2Auth has shown good performance on a relatively
large dataset, which qualifies it to be directly integrated into bibliographic
indices.
- Abstract(参考訳): 著者名の曖昧さは、名前の同義語や同義語のため、デジタル図書館において重要な問題である。
本稿では,著者の共著者パターンと研究領域に依存して,著者名を現実世界の実体に結びつける手法を提案する。
本モデルでは,著者と著者の共著者との関係を捉え,対象著者の出版物のタイトルと出典によって表される研究領域を把握し,著者を特定する。
これらの属性は、意味的および象徴的な表現によって符号化される。
この目的のために、Bib2AuthはDBLPリポジトリから約22Kの書誌記録を使用し、それぞれの共著者でトレーニングされている。
広範な実験により、同じ名前を共有する著者を区別し、異なる名前の作者を識別するアプローチの能力が証明された。
Bib2Authは比較的大きなデータセットで優れたパフォーマンスを示しており、書誌インデックスに直接組み込むことができる。
関連論文リスト
- A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - Deep Author Name Disambiguation using DBLP Data [7.081604594416337]
著者名Ambiguity(ANA)は、デジタル図書館において重要なオープン問題と考えられている。
本稿では,著者名と現実の実体をリンクする著者名曖昧化(AND)アプローチを提案する。
論文 参考訳(メタデータ) (2023-03-17T15:50:00Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Cracking Double-Blind Review: Authorship Attribution with Deep Learning [43.483063713471935]
本稿では、匿名の原稿を著者に属性付けるトランスフォーマーベースのニューラルネットワークアーキテクチャを提案する。
我々は、arXivで公開されているすべての研究論文を200万冊以上の原稿に活用する。
本手法は, 論文の最大73%を正解する, 前代未聞の著者帰属精度を実現する。
論文 参考訳(メタデータ) (2022-11-14T15:50:24Z) - A Bayesian Learning, Greedy agglomerative clustering approach and
evaluation techniques for Author Name Disambiguation Problem [0.0]
著者名はしばしば、同じ作者が異なる名前で登場することや、類似した名前を持つ複数の著者によって曖昧さに悩まされる。
私は著者名を曖昧にすることを目的とした研究努力に重点を置いています。
論文 参考訳(メタデータ) (2022-11-01T08:22:53Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - Whois? Deep Author Name Disambiguation using Bibliographic Data [7.081604594416337]
著者名Ambiguity(ANA)は、デジタル図書館において重要なオープン問題と考えられている。
本稿では,著者名と現実の実体をリンクする著者名曖昧化(AND)アプローチを提案する。
論文 参考訳(メタデータ) (2022-07-11T11:03:39Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks [81.00481125272098]
本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
論文 参考訳(メタデータ) (2020-08-30T06:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。