論文の概要: SciMantify -- A Hybrid Approach for the Evolving Semantification of Scientific Knowledge
- arxiv url: http://arxiv.org/abs/2506.21819v1
- Date: Mon, 14 Apr 2025 07:57:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-07 02:47:44.332317
- Title: SciMantify -- A Hybrid Approach for the Evolving Semantification of Scientific Knowledge
- Title(参考訳): SciMantify - 科学的知識のセマンティフィケーションを進化させるハイブリッドアプローチ
- Authors: Lena John, Kheir Eddine Farfar, Sören Auer, Oliver Karras,
- Abstract要約: 本稿では、5つ星リンクオープンデータ(LOD)モデルにインスパイアされた知識表現の進化モデルを提案する。
我々はSciMantifyと呼ばれるハイブリッドアプローチを開発し、その進化するセマンティフィケーションをサポートする。
我々は、科学知識の発見性、アクセシビリティ、相互運用性、再利用性を改善するための確立されたプラットフォームであるOpen Research Knowledge Graph(ORKG)にこのアプローチを実装します。
- 参考スコア(独自算出の注目度): 0.4499833362998487
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific publications, primarily digitized as PDFs, remain static and unstructured, limiting the accessibility and reusability of the contained knowledge. At best, scientific knowledge from publications is provided in tabular formats, which lack semantic context. A more flexible, structured, and semantic representation is needed to make scientific knowledge understandable and processable by both humans and machines. We propose an evolution model of knowledge representation, inspired by the 5-star Linked Open Data (LOD) model, with five stages and defined criteria to guide the stepwise transition from a digital artifact, such as a PDF, to a semantic representation integrated in a knowledge graph (KG). Based on an exemplary workflow implementing the entire model, we developed a hybrid approach, called SciMantify, leveraging tabular formats of scientific knowledge, e.g., results from secondary studies, to support its evolving semantification. In the approach, humans and machines collaborate closely by performing semantic annotation tasks (SATs) and refining the results to progressively improve the semantic representation of scientific knowledge. We implemented the approach in the Open Research Knowledge Graph (ORKG), an established platform for improving the findability, accessibility, interoperability, and reusability of scientific knowledge. A preliminary user experiment showed that the approach simplifies the preprocessing of scientific knowledge, reduces the effort for the evolving semantification, and enhances the knowledge representation through better alignment with the KG structures.
- Abstract(参考訳): 主にPDFとしてデジタル化された科学出版物は、静的かつ非構造化のままであり、含まれた知識のアクセシビリティと再利用性を制限する。
せいぜい、出版物からの科学的知識は、意味的な文脈に欠ける表形式で提供される。
科学的知識を人間と機械の両方で理解し、処理できるようにするためには、より柔軟で構造化された意味表現が必要である。
本稿では,5つ星リンクオープンデータ(LOD)モデルにインスパイアされた知識表現の進化モデルを提案する。5つの段階と定義基準により,PDFなどのデジタルアーティファクトから知識グラフ(KG)に組み込まれた意味表現への段階的移行を導く。
モデル全体を実装した模範的なワークフローに基づいて,SciMantifyというハイブリッドアプローチを開発した。
このアプローチでは、人間と機械は、意味的意味論タスク(SAT)を実行し、結果を精査することで、科学的知識の意味表現を徐々に改善する。
我々は、科学的知識の発見性、アクセシビリティ、相互運用性、再利用性を改善するための確立されたプラットフォームであるOpen Research Knowledge Graph(ORKG)にこのアプローチを実装した。
予備的なユーザ実験により、この手法は科学知識の事前処理を単純化し、進化するセマンティフィケーションの労力を減らし、KG構造との整合性を高めて知識表現を強化することを示した。
関連論文リスト
- The Discovery Engine: A Framework for AI-Driven Synthesis and Navigation of Scientific Knowledge Landscapes [0.0]
本稿では,文献を科学的領域の統一的,計算的に抽出可能な表現に変換するフレームワークであるDiscovery Engineを紹介する。
Discovery Engineは、AIが強化した科学調査と発見の加速のための新しいパラダイムを提供する。
論文 参考訳(メタデータ) (2025-05-23T05:51:34Z) - Knowledge AI: Fine-tuning NLP Models for Facilitating Scientific Knowledge Extraction and Understanding [0.0]
本研究は,Large Language Models (LLMs) の,特定の領域における科学的知識の理解と抽出における有効性について検討する。
トレーニング済みのモデルを採用し、科学領域のデータセットを微調整します。
論文 参考訳(メタデータ) (2024-08-04T01:32:09Z) - SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - Large Language Models for Scientific Synthesis, Inference and
Explanation [56.41963802804953]
大規模言語モデルがどのように科学的合成、推論、説明を行うことができるかを示す。
我々は,この「知識」を科学的文献から合成することで,大きな言語モデルによって強化できることを示す。
このアプローチは、大きな言語モデルが機械学習システムの予測を説明することができるというさらなる利点を持っている。
論文 参考訳(メタデータ) (2023-10-12T02:17:59Z) - Nougat: Neural Optical Understanding for Academic Documents [15.242993369368111]
我々は,科学文書をマークアップ言語に変換する光学文字認識(OCR)タスクを実行するビジュアルトランスフォーマーモデルを提案する。
提案手法は,デジタル時代の科学的知識のアクセシビリティを高めるための,有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-08-25T15:03:36Z) - KnowledgeShovel: An AI-in-the-Loop Document Annotation System for
Scientific Knowledge Base Construction [46.56643271476249]
KnowledgeShovelは、研究者が科学的知識基盤を構築するための、Al-in-the-Loop文書アノテーションシステムである。
KnowledgeShovelの設計では、多段階のマルチモーダルAIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。
7つの地学研究者によるフォローアップユーザ評価では、知識ショベルは、十分な精度で科学的知識ベースを効率的に構築できることを示している。
論文 参考訳(メタデータ) (2022-10-06T11:38:18Z) - A Computational Inflection for Scientific Discovery [48.176406062568674]
我々は科学的な発見の軌跡において、かなりの屈折の足元に立っている。
社会が急速に成長するデジタルトランスフォーメーションを継続するにつれて、人類の集団的な科学的知識も同様である。
コンピュータ科学は科学プロセス自体に革命を起こそうとしている。
論文 参考訳(メタデータ) (2022-05-04T11:36:54Z) - Expressing High-Level Scientific Claims with Formal Semantics [0.8258451067861932]
我々は、すべての分野の科学論文のサンプルから主要な主張を分析する。
それらの意味論は RDF や OWL のような形式論の直接的な応用よりも複雑である。
ここでは、このスーパーパターンの5つのスロットのインスタンス化が、高階論理における厳密に定義されたステートメントにどのように導かれるかを示す。
論文 参考訳(メタデータ) (2021-09-27T09:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。