論文の概要: High-Precision Extraction of Emerging Concepts from Scientific
Literature
- arxiv url: http://arxiv.org/abs/2006.06877v1
- Date: Thu, 11 Jun 2020 23:48:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 14:15:51.028162
- Title: High-Precision Extraction of Emerging Concepts from Scientific
Literature
- Title(参考訳): 科学文献からの創発概念の高精度抽出
- Authors: Daniel King, Doug Downey, Daniel S. Weld
- Abstract要約: 学術文献の教師なし概念抽出法を提案する。
arXivのコンピュータサイエンス論文のコーパスから、我々の手法は99%の精度@1000を達成することがわかった。
- 参考スコア(独自算出の注目度): 29.56863792319201
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identification of new concepts in scientific literature can help power
faceted search, scientific trend analysis, knowledge-base construction, and
more, but current methods are lacking. Manual identification cannot keep up
with the torrent of new publications, while the precision of existing automatic
techniques is too low for many applications. We present an unsupervised concept
extraction method for scientific literature that achieves much higher precision
than previous work. Our approach relies on a simple but novel intuition: each
scientific concept is likely to be introduced or popularized by a single paper
that is disproportionately cited by subsequent papers mentioning the concept.
From a corpus of computer science papers on arXiv, we find that our method
achieves a Precision@1000 of 99%, compared to 86% for prior work, and a
substantially better precision-yield trade-off across the top 15,000
extractions. To stimulate research in this area, we release our code and data
(https://github.com/allenai/ForeCite).
- Abstract(参考訳): 科学文献における新しい概念の同定は、パワーフェイス検索、科学トレンド分析、知識ベース構築などに役立つが、現在の方法には欠けている。
手動による識別は、新しい出版物のトレントに遅れず、既存の自動技術の精度は、多くのアプリケーションにとって低すぎる。
従来の研究よりも高い精度を実現する科学的文献の教師なし概念抽出法を提案する。
それぞれの科学的概念は、この概念を言及した後の論文で不当に引用された1つの論文によって導入または普及される可能性が高い。
arXivのコンピュータサイエンス論文のコーパスから,従来の作業の86%に対して精度@1000が99%,トップ15,000の抽出における精度-収率トレードオフが大幅に向上していることが判明した。
この領域の研究を刺激するために、コードとデータ(https://github.com/allenai/ForeCite)をリリースします。
関連論文リスト
- SciMON: Scientific Inspiration Machines Optimized for Novelty [68.46036589035539]
文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。
モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。
本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文 参考訳(メタデータ) (2023-05-23T17:12:08Z) - MIReAD: Simple Method for Learning High-quality Representations from
Scientific Documents [77.34726150561087]
論文の高品質な表現を学習する簡単な方法であるMIREADを提案する。
私たちは、2000以上のジャーナルクラスで50万以上のPubMedとarXivの抽象クラスでMIREADをトレーニングします。
論文 参考訳(メタデータ) (2023-05-07T03:29:55Z) - Cracking Double-Blind Review: Authorship Attribution with Deep Learning [43.483063713471935]
本稿では、匿名の原稿を著者に属性付けるトランスフォーマーベースのニューラルネットワークアーキテクチャを提案する。
我々は、arXivで公開されているすべての研究論文を200万冊以上の原稿に活用する。
本手法は, 論文の最大73%を正解する, 前代未聞の著者帰属精度を実現する。
論文 参考訳(メタデータ) (2022-11-14T15:50:24Z) - arXivEdits: Understanding the Human Revision Process in Scientific
Writing [17.63505461444103]
論文執筆におけるテキストリビジョン研究のための完全な計算フレームワークを提供する。
最初にarXivEditsを紹介した。これは、arXivの751個の全文からなる注釈付きコーパスで、複数のバージョンにまたがってゴールドの文をアライメントする。
データ駆動分析をサポートし、論文の改訂のために研究者が実践する一般的な戦略を明らかにします。
論文 参考訳(メタデータ) (2022-10-26T22:50:24Z) - FPSRS: A Fusion Approach for Paper Submission Recommendation System [0.0]
本稿では,科学論文を推薦する2つの新しいアプローチを提案する。
最初のアプローチでは、Conv1D以外にもRNN構造を採用している。
また,DistilBertAimsという新しい手法を導入し,大文字小文字と小文字小文字の2例にDistillBertを用いて, Title, Abstract, Keywordsなどの特徴をベクトル化する。
実験の結果、第2のアプローチはパフォーマンスが向上し、62.46%、12.44%が従来の研究よりも高いことがわかった。
論文 参考訳(メタデータ) (2022-05-12T09:06:56Z) - Quantum verification and estimation with few copies [63.669642197519934]
大規模絡み合ったシステムの検証と推定は、信頼性の高い量子情報処理にそのようなシステムを用いる際の大きな課題の1つである。
本稿では,資源の一定数(サンプリング複雑性)に着目し,任意の次元のシステムに適していることを示す。
具体的には、量子状態トモグラフィー(quantum state tomography)の概念とともに、エンタングルメント検出のために少なくとも1つのコピーだけを必要とする確率的フレームワークをレビューする。
論文 参考訳(メタデータ) (2021-09-08T18:20:07Z) - Linking Health News to Research Literature [12.80865601729801]
ニュース記事と科学研究を正確に関連付けることは、多くの応用において重要な要素である。
ニュースと文学の結びつきの欠如はこれらの応用において課題となっているが、これは比較的未解明の研究問題である。
論文 参考訳(メタデータ) (2021-07-14T03:50:51Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Will This Idea Spread Beyond Academia? Understanding Knowledge Transfer
of Scientific Concepts across Text Corpora [18.76916879679805]
我々はすべての科学分野の科学的概念のレベルで翻訳研究を研究する。
我々は「研究アイデア」のインスタンス化としてコーパスから科学的概念を抽出する。
そして、45万以上の新しい概念の軌跡を辿って、これらのアイデアのごく一部しか発明や薬物の試行に使われていない要因を特定します。
論文 参考訳(メタデータ) (2020-10-13T19:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。