論文の概要: A Bayesian Learning, Greedy agglomerative clustering approach and
evaluation techniques for Author Name Disambiguation Problem
- arxiv url: http://arxiv.org/abs/2211.01303v1
- Date: Tue, 1 Nov 2022 08:22:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 14:51:07.931415
- Title: A Bayesian Learning, Greedy agglomerative clustering approach and
evaluation techniques for Author Name Disambiguation Problem
- Title(参考訳): 著者名曖昧化問題に対するベイズ学習, グリーディ集約クラスタリング手法と評価手法
- Authors: Shashwat Sourav
- Abstract要約: 著者名はしばしば、同じ作者が異なる名前で登場することや、類似した名前を持つ複数の著者によって曖昧さに悩まされる。
私は著者名を曖昧にすることを目的とした研究努力に重点を置いています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Author names often suffer from ambiguity owing to the same author appearing
under different names and multiple authors possessing similar names. It creates
difficulty in associating a scholarly work with the person who wrote it,
thereby introducing inaccuracy in credit attribution, bibliometric analysis,
search-by-author in a digital library, and expert discovery. A plethora of
techniques for disambiguation of author names has been proposed in the
literature. I try to focus on the research efforts targeted to disambiguate
author names. I first go through the conventional methods, then I discuss
evaluation techniques and the clustering model which finally leads to the
Bayesian learning and Greedy agglomerative approach. I believe this
concentrated review will be useful for the research community because it
discusses techniques applied to a very large real database that is actively
used worldwide. The Bayesian and the greedy agglomerative approach used will
help to tackle AND problems in a better way. Finally, I try to outline a few
directions for future work
- Abstract(参考訳): 著者名はしばしば、同じ作者が異なる名前で登場することと、類似した名前を持つ複数の著者によって曖昧さに悩まされる。
これにより、著者と学術研究の関連付けが難しくなり、信用帰属、書誌分析、デジタル図書館における著者による検索、エキスパート発見の正確性が低下する。
著者名の曖昧化のための技法が文献に多数提案されている。
著者名の曖昧さを解消するための研究に焦点を合わせます。
まず,評価手法とクラスタリングモデルについて検討し,ベイズ学習とグリーディ集合的アプローチを導いた。
この集中レビューは、世界中で活発に使われている非常に大きな実データベースに適用できる技術について議論するため、研究コミュニティにとって役立つと思います。
bayesian と greedy agglomerative のアプローチは、よりよい方法で取り組み、問題を解決するのに役立ちます。
最後に、私は今後の仕事の方向性を概観する。
関連論文リスト
- A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Deep Author Name Disambiguation using DBLP Data [7.081604594416337]
著者名Ambiguity(ANA)は、デジタル図書館において重要なオープン問題と考えられている。
本稿では,著者名と現実の実体をリンクする著者名曖昧化(AND)アプローチを提案する。
論文 参考訳(メタデータ) (2023-03-17T15:50:00Z) - Author Name Disambiguation via Heterogeneous Network Embedding from
Structural and Semantic Perspectives [13.266320447769564]
名前の曖昧さは、複数の著者が同じ名前を持つなど、学術的なデジタル図書館で一般的である。
提案手法は主に異種ネットワークとクラスタリングのための表現学習に基づいている。
意味表現はNLPツールを使用して生成される。
論文 参考訳(メタデータ) (2022-12-24T11:22:34Z) - Cracking Double-Blind Review: Authorship Attribution with Deep Learning [43.483063713471935]
本稿では、匿名の原稿を著者に属性付けるトランスフォーマーベースのニューラルネットワークアーキテクチャを提案する。
我々は、arXivで公開されているすべての研究論文を200万冊以上の原稿に活用する。
本手法は, 論文の最大73%を正解する, 前代未聞の著者帰属精度を実現する。
論文 参考訳(メタデータ) (2022-11-14T15:50:24Z) - Tag-Aware Document Representation for Research Paper Recommendation [68.8204255655161]
本稿では,ユーザによって割り当てられたソーシャルタグに基づいて,研究論文の深い意味表現を活用するハイブリッドアプローチを提案する。
提案手法は,評価データが極めて少ない場合でも研究論文の推薦に有効である。
論文 参考訳(メタデータ) (2022-09-08T09:13:07Z) - Whois? Deep Author Name Disambiguation using Bibliographic Data [7.081604594416337]
著者名Ambiguity(ANA)は、デジタル図書館において重要なオープン問題と考えられている。
本稿では,著者名と現実の実体をリンクする著者名曖昧化(AND)アプローチを提案する。
論文 参考訳(メタデータ) (2022-07-11T11:03:39Z) - Bib2Auth: Deep Learning Approach for Author Disambiguation using
Bibliographic Data [4.817368273632451]
著者名と現実の実体をリンクする新しい手法を,共著者パターンと研究領域に頼って提案する。
教師付きディープラーニングモデルでは,著者と共著者との関係や研究領域を把握し,著者を識別する。
Bib2Authは比較的大きなデータセットで優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2021-07-09T12:25:11Z) - DeepStyle: User Style Embedding for Authorship Attribution of Short
Texts [57.503904346336384]
オーサシップアトリビューション(AA)は、多くのアプリケーションで重要で広く研究されている研究トピックです。
近年の研究では、深層学習がAAタスクの精度を大幅に向上させることが示されている。
本稿では,ユーザの健全な書き込みスタイルの表現を学習する新しい埋め込み型フレームワークであるDeepStyleを提案する。
論文 参考訳(メタデータ) (2021-03-14T15:56:37Z) - Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks [81.00481125272098]
本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
論文 参考訳(メタデータ) (2020-08-30T06:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。