論文の概要: Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain
- arxiv url: http://arxiv.org/abs/2011.01103v1
- Date: Wed, 28 Oct 2020 08:31:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 04:28:23.351893
- Title: Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain
- Title(参考訳): 学術領域における自然言語処理と機械学習技術を活用した知識グラフの作成
- Authors: Danilo Dess\`i, Francesco Osborne, Diego Reforgiato Recupero, Davide
Buscaldi, Enrico Motta
- Abstract要約: 本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
- 参考スコア(独自算出の注目度): 1.9004296236396943
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The continuous growth of scientific literature brings innovations and, at the
same time, raises new challenges. One of them is related to the fact that its
analysis has become difficult due to the high volume of published papers for
which manual effort for annotations and management is required. Novel
technological infrastructures are needed to help researchers, research policy
makers, and companies to time-efficiently browse, analyse, and forecast
scientific research. Knowledge graphs i.e., large networks of entities and
relationships, have proved to be effective solution in this space. Scientific
knowledge graphs focus on the scholarly domain and typically contain metadata
describing research publications such as authors, venues, organizations,
research topics, and citations. However, the current generation of knowledge
graphs lacks of an explicit representation of the knowledge presented in the
research papers. As such, in this paper, we present a new architecture that
takes advantage of Natural Language Processing and Machine Learning methods for
extracting entities and relationships from research publications and integrates
them in a large-scale knowledge graph. Within this research work, we i) tackle
the challenge of knowledge extraction by employing several state-of-the-art
Natural Language Processing and Text Mining tools, ii) describe an approach for
integrating entities and relationships generated by these tools, iii) show the
advantage of such an hybrid system over alternative approaches, and vi) as a
chosen use case, we generated a scientific knowledge graph including 109,105
triples, extracted from 26,827 abstracts of papers within the Semantic Web
domain. As our approach is general and can be applied to any domain, we expect
that it can facilitate the management, analysis, dissemination, and processing
of scientific knowledge.
- Abstract(参考訳): 科学文献の継続的な成長はイノベーションをもたらし、同時に新たな課題を提起する。
そのうちの1つは,アノテーションや管理に手作業が必要とされる論文の大量発生により,解析が困難になったことに関連している。
研究者、研究政策立案者、企業は科学的研究を時間効率よく閲覧し、分析し、予測するために新しい技術基盤が必要である。
知識グラフ、すなわちエンティティと関係のネットワークは、この分野において効果的な解であることが証明されている。
科学知識グラフは学術分野に焦点を当てており、典型的には著者、会場、組織、研究トピック、引用などの研究出版物を記述するメタデータを含んでいる。
しかし、現在の知識グラフは研究論文に示された知識の明示的な表現を欠いている。
そこで本稿では,研究論文からエンティティや関係を抽出し,それらを大規模知識グラフに統合する自然言語処理と機械学習の手法を活用した新しいアーキテクチャを提案する。
この研究の中で私たちは
一 最先端の自然言語処理及びテキストマイニングツールを用いて知識抽出の課題に取り組むこと。
二 これらのツールが生み出す実体及び関係を統合するための方法を記述すること。
iii) 代替アプローチよりもハイブリッドシステムの利点を示し,vi) 選択したユースケースとして,セマンティックwebドメイン内の論文の要約26,827点から抽出した109,105点を含む科学的知識グラフを作成した。
我々のアプローチは一般的であり、あらゆる分野に適用できるので、科学知識の管理、分析、普及、処理を促進できると期待している。
関連論文リスト
- Automating Bibliometric Analysis with Sentence Transformers and Retrieval-Augmented Generation (RAG): A Pilot Study in Semantic and Contextual Search for Customized Literature Characterization for High-Impact Urban Research [2.1728621449144763]
文献分析は、都市科学における研究動向、スコープ、影響を理解するために不可欠である。
キーワード検索に依存する伝統的な手法は、記事のタイトルやキーワードに明記されていない価値ある洞察を明らかにするのに失敗することが多い。
我々は、生成AIモデル、特にトランスフォーマーとレトリーバル拡張生成(RAG)を活用して、バイオロメトリ分析の自動化と強化を行う。
論文 参考訳(メタデータ) (2024-10-08T05:13:27Z) - Ontology Embedding: A Survey of Methods, Applications and Resources [54.3453925775069]
オントロジはドメイン知識とメタデータを表現するために広く使われている。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
埋め込みに関する多くの論文が出版されているが、体系的なレビューの欠如により、研究者はこの分野の包括的な理解を妨げている。
論文 参考訳(メタデータ) (2024-06-16T14:49:19Z) - Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model [16.030268397865264]
本稿では,高度な自然言語処理技術を活用したマテリアル知識グラフ(MKG)を紹介する。
MKGは、情報を名前、フォーミュラ、アプリケーションなどの包括的なラベルに分類する。
ネットワークベースのアルゴリズムを実装することで、MKGは効率的なリンク予測を容易にするだけでなく、従来の実験手法への依存を著しく低減する。
論文 参考訳(メタデータ) (2024-04-03T21:46:14Z) - AceMap: Knowledge Discovery through Academic Graph [90.12694363549483]
AceMapは学術グラフによる知識発見のために設計された学術システムである。
本稿では,AceMapデータベースを構築するための高度なデータベース構築手法を提案する。
AceMapは、学術的アイデアの進化をトレースするなど、高度な分析機能を提供する。
論文 参考訳(メタデータ) (2024-03-05T01:17:56Z) - An approach based on Open Research Knowledge Graph for Knowledge
Acquisition from scientific papers [4.8951183832371]
Open Research Knowledge Graph (ORKG)は、研究論文から抽出されたキーインサイトを整理するコンピュータ支援ツールである。
現在、"食品情報工学"、"知識グラフマッチングへのタブラリデータ"、"クエストアンサーリング"研究問題、"Neuro-symbolic AI"ドメインの文書化に使用されている。
論文 参考訳(メタデータ) (2023-08-23T20:05:42Z) - Iterative Zero-Shot LLM Prompting for Knowledge Graph Construction [104.29108668347727]
本稿では,最新の生成型大規模言語モデルの可能性を活用する,革新的な知識グラフ生成手法を提案する。
このアプローチは、新しい反復的なゼロショットと外部知識に依存しない戦略を含むパイプラインで伝達される。
我々は、我々の提案がスケーラブルで多目的な知識グラフ構築に適したソリューションであり、異なる新しい文脈に適用できると主張している。
論文 参考訳(メタデータ) (2023-07-03T16:01:45Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Citation Trajectory Prediction via Publication Influence Representation
Using Temporal Knowledge Graph [52.07771598974385]
既存のアプローチは主に学術論文の時間的データとグラフデータのマイニングに依存している。
本フレームワークは,差分保存グラフ埋め込み,きめ細かい影響表現,学習に基づく軌道計算という3つのモジュールから構成される。
APSアカデミックデータセットとAIPatentデータセットの両方で実験を行った。
論文 参考訳(メタデータ) (2022-10-02T07:43:26Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。