論文の概要: Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles
- arxiv url: http://arxiv.org/abs/2104.12869v1
- Date: Mon, 26 Apr 2021 20:37:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 00:05:39.233737
- Title: Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles
- Title(参考訳): 研究論文の潜在的影響の自動評価のための意味分析
- Authors: Neslihan Suzen, Alexander Gorban, Jeremy Levesley and Evgeny Mirkes
- Abstract要約: 本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Can the analysis of the semantics of words used in the text of a scientific
paper predict its future impact measured by citations? This study details
examples of automated text classification that achieved 80% success rate in
distinguishing between highly-cited and little-cited articles. Automated
intelligent systems allow the identification of promising works that could
become influential in the scientific community.
The problems of quantifying the meaning of texts and representation of human
language have been clear since the inception of Natural Language Processing.
This paper presents a novel method for vector representation of text meaning
based on information theory and show how this informational semantics is used
for text classification on the basis of the Leicester Scientific Corpus.
We describe the experimental framework used to evaluate the impact of
scientific articles through their informational semantics. Our interest is in
citation classification to discover how important semantics of texts are in
predicting the citation count. We propose the semantics of texts as an
important factor for citation prediction.
For each article, our system extracts the abstract of paper, represents the
words of the abstract as vectors in Meaning Space, automatically analyses the
distribution of scientific categories (Web of Science categories) within the
text of abstract, and then classifies papers according to citation counts
(highly-cited, little-cited).
We show that an informational approach to representing the meaning of a text
has offered a way to effectively predict the scientific impact of research
papers.
- Abstract(参考訳): 科学論文のテキストで使われる単語の意味分析は、引用による未来の影響を予測することができるか?
本研究は,高引用記事と低引用記事の区別において80%の成功率を達成した自動テキスト分類の例を詳述する。
自動化された知的システムは、科学コミュニティに影響を与えうる有望な作品の識別を可能にする。
自然言語処理の開始以来,テキストの意味と人間の言語表現の定量化の問題点が明らかになってきた。
本稿では,情報理論に基づくテキスト意味のベクトル表現法を提案し,この情報意味論がレスター科学コーパスに基づいてテキスト分類にどのように用いられるかを示す。
本稿では,学術論文の影響を,その情報的意味を通して評価する実験的枠組みについて述べる。
我々の関心は、引用数を予測する上でテキストのセマンティクスがいかに重要であるかを明らかにするための引用分類である。
引用予測の重要な要素として,テキストの意味論を提案する。
各論文について,論文の要約を抽出し,意味空間のベクトルとしての抽象語を表現し,要約のテキスト内の科学カテゴリ(Web of Scienceカテゴリ)の分布を自動的に解析し,引用数に応じて論文を分類する。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
関連論文リスト
- CausalCite: A Causal Formulation of Paper Citations [80.82622421055734]
CausalCiteは紙の意義を測定するための新しい方法だ。
これは、従来のマッチングフレームワークを高次元のテキスト埋め込みに適応させる、新しい因果推論手法であるTextMatchに基づいている。
科学専門家が報告した紙衝撃と高い相関性など,各種基準におけるCausalCiteの有効性を実証する。
論文 参考訳(メタデータ) (2023-11-05T23:09:39Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - An Informational Space Based Semantic Analysis for Scientific Texts [62.997667081978825]
本稿では、意味分析のための計算手法と、短い科学的テキストの意味の定量化について紹介する。
科学的意味の表現は、心理的特性ではなく、状況表現を置き換えることで標準化される。
本研究は,テキストの意味の幾何学的表現の基礎となる研究である。
論文 参考訳(メタデータ) (2022-05-31T11:19:32Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Evaluating Sparse Interpretable Word Embeddings for Biomedical Domain [1.3526604206343171]
解釈可能性(英: Interpretability)は、生体医学的応用において不可欠な部分である正当化の鍵となる手段である。
医療領域における単語埋め込みの解釈可能性に関する包括的研究を行い,スパース法の役割に着目した。
実験結果から, 下流タスクにおける元のベクトルの性能を保ちながら, 疎単語ベクトルの方がはるかに解釈可能性が高いことがわかった。
論文 参考訳(メタデータ) (2020-05-11T13:56:58Z) - ImpactCite: An XLNet-based method for Citation Impact Analysis [4.526582372434088]
インパクト分析により、引用の質を定量化できます。
XLNetベースのソリューションであるImpactCiteは、引用意図と感情分類の両方に対して、最先端のパフォーマンスを実現する。
CSC-Clean corpusは引用感情分類のためのクリーンで信頼性の高いデータセットである。
論文 参考訳(メタデータ) (2020-05-05T08:31:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。