論文の概要: Prioritization of COVID-19-related literature via unsupervised keyphrase
extraction and document representation learning
- arxiv url: http://arxiv.org/abs/2110.08874v1
- Date: Sun, 17 Oct 2021 17:35:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-20 09:32:56.917893
- Title: Prioritization of COVID-19-related literature via unsupervised keyphrase
extraction and document representation learning
- Title(参考訳): 無監督キーフレーズ抽出と文書表現学習によるCOVID-19関連文献の優先順位付け
- Authors: Bla\v{z} \v{S}krlj and Marko Juki\v{c} and Nika Er\v{z}en and Senja
Pollak and Nada Lavra\v{c}
- Abstract要約: 新型コロナウイルス(COVID-19)のパンデミックは、手作業で適切な時間枠で検査や研究が不可能な、新しい科学文献の波を引き起こした。
現在の機械学習手法では、類似した文書が互いに近接しているベクトル空間にそのような文献を投影する。
本システムでは, ウイルス関連文献の現在の体は, 教師なしキーフレーズ抽出を用いて注釈付けされている。
このソリューションは、対話型検索、用語ランキング、潜在的に興味深い文献の探索が可能なWebサーバを通じてアクセス可能である。
- 参考スコア(独自算出の注目度): 1.8374319565577157
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The COVID-19 pandemic triggered a wave of novel scientific literature that is
impossible to inspect and study in a reasonable time frame manually. Current
machine learning methods offer to project such body of literature into the
vector space, where similar documents are located close to each other, offering
an insightful exploration of scientific papers and other knowledge sources
associated with COVID-19. However, to start searching, such texts need to be
appropriately annotated, which is seldom the case due to the lack of human
resources. In our system, the current body of COVID-19-related literature is
annotated using unsupervised keyphrase extraction, facilitating the initial
queries to the latent space containing the learned document embeddings
(low-dimensional representations). The solution is accessible through a web
server capable of interactive search, term ranking, and exploration of
potentially interesting literature. We demonstrate the usefulness of the
approach via case studies from the medicinal chemistry domain.
- Abstract(参考訳): 新型コロナウイルスのパンデミックは、手作業で適切な時間枠で検査や研究が不可能な、新しい科学文献の波を引き起こした。
現在の機械学習手法では、同様の文書が互いに近接しているベクトル空間にそのような文献を投影し、COVID-19に関連する科学論文やその他の知識ソースの洞察に富んだ調査を提供する。
しかし、検索を始めるには、そのようなテキストに適切な注釈をつける必要がある。
本システムでは, 学習した文書の埋め込み(低次元表現)を含む潜伏空間への初期クエリを容易にするために, 教師なしキーフレーズ抽出を用いて, 現行のCOVID-19関連文献に注釈を付けている。
このソリューションは、インタラクティブな検索、タームランキング、潜在的に興味深い文献の探索が可能なwebサーバを通じてアクセスできる。
医薬化学領域のケーススタディを通じて, 本手法の有用性を実証する。
関連論文リスト
- Embedding Knowledge for Document Summarization: A Survey [66.76415502727802]
従来の研究は、知識を組み込んだ文書要約器が優れた消化器を生成するのに優れていたことを証明した。
本稿では,文書要約ビューに基づいて,知識と知識の埋め込みを再カプセル化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-24T04:36:07Z) - A Transfer Learning Pipeline for Educational Resource Discovery with
Application in Leading Paragraph Generation [71.92338855383238]
本稿では,新しいドメインに対するWebリソース発見を自動化するパイプラインを提案する。
パイプラインは2つの類似しているが新規なターゲットドメインで評価すると、F1スコアは0.94と0.82となる。
本研究は,サーベイジェネレーションのための各種Webリソースを考察した最初の研究である。
論文 参考訳(メタデータ) (2022-01-07T03:35:40Z) - COVID-19 Multidimensional Kaggle Literature Organization [3.201839066679614]
因子化は文書コーパスに隠されたパターンを発見できる強力な教師なし学習手法であることを示す。
コーパスの高次表現により,類似記事,関連雑誌,類似研究論文の執筆者,話題キーワードの同時グループ化が可能となることを示す。
論文 参考訳(メタデータ) (2021-07-17T06:16:36Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - A New Neural Search and Insights Platform for Navigating and Organizing
AI Research [56.65232007953311]
我々は、古典的なキーワード検索とニューラル検索を組み合わせた新しいプラットフォームであるAI Research Navigatorを導入し、関連する文献を発見し整理する。
本稿では,システム全体のアーキテクチャの概要と,文書分析,質問応答,検索,分析,専門家検索,レコメンデーションの構成要素について概説する。
論文 参考訳(メタデータ) (2020-10-30T19:12:25Z) - COVID-19 Literature Topic-Based Search via Hierarchical NMF [29.04869940568828]
新型コロナウイルス関連の科学文献のデータセットが収集される。
階層的非負のマトリックス因子化は、新型コロナウイルスに関する文献を木構造に整理するために用いられる。
論文 参考訳(メタデータ) (2020-09-07T05:45:03Z) - Navigating the landscape of COVID-19 research through literature
analysis: A bird's eye view [11.362549790802483]
我々は、2020年5月15日時点でPubMedで見つかった13,369のCOVID-19関連記事、LitCovidコレクションを分析した。
我々は、最先端のエンティティ認識、分類、クラスタリング、その他のNLP技術を適用する。
クラスタリングアルゴリズムは,関連用語群で表されるトピックを識別し,関連する文書に対応するクラスタを算出する。
論文 参考訳(メタデータ) (2020-08-07T23:39:29Z) - COVID-19 Kaggle Literature Organization [29.959515544730348]
世界は、2020年に重症急性呼吸症候群のコロナウイルス-2(SARS-CoV-2)の壊滅的な流行に直面している。
この問題の研究は、科学者が新しい発見に追いつくのに苦労している点まで、急速に追跡された。
本稿では、機械学習技術を用いて、新型コロナウイルスに関する科学文献を整理、視覚化するアプローチについて述べる。
論文 参考訳(メタデータ) (2020-08-04T21:02:32Z) - COVID-19 therapy target discovery with context-aware literature mining [5.839799877302573]
本稿では,エンティティ間の関係を近似することで,経験的表現データの文脈化を行うシステムを提案する。
トランスファーラーニングによりより大きな科学的文脈を活用するために,新しい埋め込み生成手法を提案する。
論文 参考訳(メタデータ) (2020-07-30T18:37:36Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z) - CAiRE-COVID: A Question Answering and Query-focused Multi-Document
Summarization System for COVID-19 Scholarly Information Management [48.251211691263514]
我々は、リアルタイム質問応答(QA)とマルチドキュメント要約システムであるCAiRE-COVIDを紹介し、Kaggle COVID-19 Open Researchデータセットチャレンジで10のタスクのうちの1つを勝ち取った。
本システムの目的は,コミュニティからの優先度の高い質問に答えることによって,新型コロナウイルスに関する数多くの学術論文をマイニングすることにある。
論文 参考訳(メタデータ) (2020-05-04T15:07:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。