論文の概要: Advancing Scientific Knowledge Retrieval and Reuse with a Novel Digital Library for Machine-Readable Knowledge
- arxiv url: http://arxiv.org/abs/2511.08476v1
- Date: Wed, 12 Nov 2025 02:00:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.832068
- Title: Advancing Scientific Knowledge Retrieval and Reuse with a Novel Digital Library for Machine-Readable Knowledge
- Title(参考訳): 機械可読知識のための新しいデジタルライブラリによる科学知識検索と再利用の促進
- Authors: Hadi Ghaemi, Lauren Snyder, Markus Stocker,
- Abstract要約: ORKG rebornは、科学的知識の正確な、きめ細かい、再現可能な機械可読表現の発見、アクセス、再利用をサポートする、新興デジタルライブラリである。
提案システムについて述べるとともに,現状のデジタルライブラリや文書中心の学術コミュニケーションとは対照的に,その実用性と情報検索の可能性を示す。
- 参考スコア(独自算出の注目度): 4.450387519903374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital libraries for research, such as the ACM Digital Library or Semantic Scholar, do not enable the machine-supported, efficient reuse of scientific knowledge (e.g., in synthesis research). This is because these libraries are based on document-centric models with narrative text knowledge expressions that require manual or semi-automated knowledge extraction, structuring, and organization. We present ORKG reborn, an emerging digital library that supports finding, accessing, and reusing accurate, fine-grained, and reproducible machine-readable expressions of scientific knowledge that relate scientific statements and their supporting evidence in terms of data and code. The rich expressions of scientific knowledge are published as reborn (born-reusable) articles and provide novel possibilities for scientific knowledge retrieval, for instance by statistical methods, software packages, variables, or data matching specific constraints. We describe the proposed system and demonstrate its practical viability and potential for information retrieval in contrast to state-of-the-art digital libraries and document-centric scholarly communication using several published articles in research fields ranging from computer science to soil science. Our work underscores the enormous potential of scientific knowledge databases and a viable approach to their construction.
- Abstract(参考訳): ACM Digital LibraryやSemantic Scholarのような研究用のデジタルライブラリは、機械が支援する科学知識の効率的な再利用(例えば合成研究)を可能にしない。
これは、これらのライブラリが手動または半自動の知識抽出、構造化、組織化を必要とする物語テキスト知識表現を備えた文書中心モデルに基づいているためである。
データとコードの観点から科学的ステートメントとそれらの支持する証拠を関連づけた、正確できめ細かな、再現可能な科学的知識の機械可読表現の発見、アクセス、再利用を支援する、新興デジタルライブラリORKG rebornを提示する。
科学知識の豊かな表現は、生まれ変わり(再利用可能な)論文として出版され、統計手法、ソフトウェアパッケージ、変数、特定の制約に適合するデータなどによって科学知識を検索する新たな可能性を提供する。
提案システムについて述べるとともに,コンピュータ科学から土壌科学までの研究分野におけるいくつかの論文を用いて,最先端のデジタルライブラリや文書中心の学術コミュニケーションとは対照的に,その実用性と情報検索の可能性を示す。
我々の研究は、科学的知識データベースの膨大な可能性と、その構築への実行可能なアプローチを浮き彫りにしている。
関連論文リスト
- Nougat: Neural Optical Understanding for Academic Documents [15.242993369368111]
我々は,科学文書をマークアップ言語に変換する光学文字認識(OCR)タスクを実行するビジュアルトランスフォーマーモデルを提案する。
提案手法は,デジタル時代の科学的知識のアクセシビリティを高めるための,有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-08-25T15:03:36Z) - CLAIMED -- the open source framework for building coarse-grained
operators for accelerated discovery in science [0.0]
CLAIMEDは、科学者が科学演算子を再コンパイルすることによって以前の研究から引き出すのを支援することで、再利用可能な演算子とスケーラブルな科学的不可知性を構築するためのフレームワークである。
CLAIMEDはプログラミング言語、科学ライブラリ、実行環境である。
論文 参考訳(メタデータ) (2023-07-12T11:54:39Z) - The Semantic Scholar Open Data Platform [92.2948743167744]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - KnowledgeShovel: An AI-in-the-Loop Document Annotation System for
Scientific Knowledge Base Construction [46.56643271476249]
KnowledgeShovelは、研究者が科学的知識基盤を構築するための、Al-in-the-Loop文書アノテーションシステムである。
KnowledgeShovelの設計では、多段階のマルチモーダルAIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。
7つの地学研究者によるフォローアップユーザ評価では、知識ショベルは、十分な精度で科学的知識ベースを効率的に構築できることを示している。
論文 参考訳(メタデータ) (2022-10-06T11:38:18Z) - A Computational Inflection for Scientific Discovery [48.176406062568674]
我々は科学的な発見の軌跡において、かなりの屈折の足元に立っている。
社会が急速に成長するデジタルトランスフォーメーションを継続するにつれて、人類の集団的な科学的知識も同様である。
コンピュータ科学は科学プロセス自体に革命を起こそうとしている。
論文 参考訳(メタデータ) (2022-05-04T11:36:54Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。