論文の概要: Expressing High-Level Scientific Claims with Formal Semantics
- arxiv url: http://arxiv.org/abs/2109.12907v1
- Date: Mon, 27 Sep 2021 09:52:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-29 03:32:54.041272
- Title: Expressing High-Level Scientific Claims with Formal Semantics
- Title(参考訳): フォーマルセマンティックスによる高レベル科学的クレームの表現
- Authors: Cristina-Iulia Bucur and Tobias Kuhn and Davide Ceolin and Jacco van
Ossenbruggen
- Abstract要約: 我々は、すべての分野の科学論文のサンプルから主要な主張を分析する。
それらの意味論は RDF や OWL のような形式論の直接的な応用よりも複雑である。
ここでは、このスーパーパターンの5つのスロットのインスタンス化が、高階論理における厳密に定義されたステートメントにどのように導かれるかを示す。
- 参考スコア(独自算出の注目度): 0.8258451067861932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of semantic technologies is gaining significant traction in science
communication with a wide array of applications in disciplines including the
Life Sciences, Computer Science, and the Social Sciences. Languages like RDF,
OWL, and other formalisms based on formal logic are applied to make scientific
knowledge accessible not only to human readers but also to automated systems.
These approaches have mostly focused on the structure of scientific
publications themselves, on the used scientific methods and equipment, or on
the structure of the used datasets. The core claims or hypotheses of scientific
work have only been covered in a shallow manner, such as by linking mentioned
entities to established identifiers. In this research, we therefore want to
find out whether we can use existing semantic formalisms to fully express the
content of high-level scientific claims using formal semantics in a systematic
way. Analyzing the main claims from a sample of scientific articles from all
disciplines, we find that their semantics are more complex than what a
straight-forward application of formalisms like RDF or OWL account for, but we
managed to elicit a clear semantic pattern which we call the 'super-pattern'.
We show here how the instantiation of the five slots of this super-pattern
leads to a strictly defined statement in higher-order logic. We successfully
applied this super-pattern to an enlarged sample of scientific claims. We show
that knowledge representation experts, when instructed to independently
instantiate the super-pattern with given scientific claims, show a high degree
of consistency and convergence given the complexity of the task and the
subject. These results therefore open the door for expressing high-level
scientific findings in a manner they can be automatically interpreted, which on
the longer run can allow us to do automated consistency checking, and much
more.
- Abstract(参考訳): セマンティックテクノロジーの利用は、生命科学、コンピュータ科学、社会科学など、幅広い分野の分野の応用と科学コミュニケーションにおいて大きな牽引力となっている。
RDF、OWL、その他の形式論理に基づく言語は、人間の読者だけでなく、自動システムにも科学的知識をアクセスできるようにするために用いられる。
これらのアプローチは、主に科学出版物自体の構造、使用済みの科学的方法や機器、使用済みデータセットの構造に焦点を当てている。
科学的研究の中核的な主張や仮説は、言及された実体を確立された識別子にリンクすることなど、浅い方法でのみカバーされている。
そこで本研究では,既存の意味論的形式を用いて,形式的意味論を用いた高度な科学的主張の内容を体系的に表現できるかどうかを確かめたい。
すべての分野の科学論文のサンプルから主要な主張を分析したところ、それらの意味論はRDFやOWLのような形式主義の真正面適用よりも複雑であることがわかったが、我々は「スーパーパターン」と呼ぶ明確な意味パターンを引き出すことができた。
ここでは、このスーパーパターンの5つのスロットのインスタンス化が、高階論理における厳密に定義されたステートメントをもたらす方法を示す。
我々は、このスーパーパターンを科学的な主張の拡大サンプルに適用することに成功しました。
知識表現の専門家は、与えられた科学的主張と独立してスーパーパターンをインスタンス化するように指示されると、タスクと課題の複雑さから高い一貫性と収束性を示す。
したがって、これらの結果は、自動的に解釈できる方法で、ハイレベルな科学的発見を表現するための扉を開くことができる。
関連論文リスト
- LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。
本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。
法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文 参考訳(メタデータ) (2024-05-16T03:04:10Z) - Scientific Large Language Models: A Survey on Biological & Chemical Domains [47.97810890521825]
大規模言語モデル(LLM)は、自然言語理解の強化において、変革的な力として現れてきた。
LLMの応用は従来の言語境界を超えて、様々な科学分野で開発された専門的な言語システムを含んでいる。
AI for Science(AI for Science)のコミュニティで急成長している分野として、科学LLMは包括的な探査を義務付けている。
論文 参考訳(メタデータ) (2024-01-26T05:33:34Z) - An Interdisciplinary Outlook on Large Language Models for Scientific
Research [3.4108358650013573]
本稿では,異なる学問分野におけるLarge Language Models(LLM)の機能と制約について述べる。
本稿では, LLM が学術調査の強化を図り, 大量の出版物を要約することで, 文献レビューの促進などの具体的な事例を提示する。
LLMが直面する課題には、広範囲で偏見のあるデータセットへの依存や、それらの使用から生じる潜在的な倫理的ジレンマが含まれる。
論文 参考訳(メタデータ) (2023-11-03T19:41:09Z) - Large Language Models for Scientific Synthesis, Inference and
Explanation [56.41963802804953]
大規模言語モデルがどのように科学的合成、推論、説明を行うことができるかを示す。
我々は,この「知識」を科学的文献から合成することで,大きな言語モデルによって強化できることを示す。
このアプローチは、大きな言語モデルが機械学習システムの予測を説明することができるというさらなる利点を持っている。
論文 参考訳(メタデータ) (2023-10-12T02:17:59Z) - Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.40483334131271]
本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。
従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。
パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文 参考訳(メタデータ) (2023-09-06T05:19:41Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - AI Research Associate for Early-Stage Scientific Discovery [1.6861004263551447]
人工知能(AI)は科学活動に何十年も使われ続けている。
我々は、最小バイアスの物理に基づくモデリングに基づく、初期段階の科学的発見のためのAI研究アソシエイトを提案する。
論文 参考訳(メタデータ) (2022-02-02T17:05:52Z) - Automated Creation and Human-assisted Curation of Computable Scientific
Models from Code and Text [2.3746609573239756]
ドメインエキスパートは、コードに詳しくなければ、科学的モデルの実装を完全に理解することはできない。
我々は,科学モデルの自動作成と人手によるキュレーションのためのシステムを開発した。
本研究では,NASAのハイパーソニック・エアロダイナミックス(Hypersonic Aerodynamics)のウェブサイトから得られたコードと関連テキストのデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2022-01-28T17:31:38Z) - Fact-driven Logical Reasoning for Machine Reading Comprehension [82.58857437343974]
私たちは、常識と一時的な知識のヒントの両方を階層的にカバーする動機があります。
具体的には,文の背骨成分を抽出し,知識単位の一般的な定式化を提案する。
次に、事実単位の上にスーパーグラフを構築し、文レベル(事実群間の関係)と実体レベルの相互作用の利点を享受する。
論文 参考訳(メタデータ) (2021-05-21T13:11:13Z) - Knowledge Elicitation using Deep Metric Learning and Psychometric
Testing [15.989397781243225]
画像やビデオなどの高次元データを扱う専門家から,効率的な階層的知識の抽出方法を提案する。
開発されたモデルは、距離が意味論的に意味のある距離空間に高次元データを埋め込み、データは階層構造で整理することができる。
論文 参考訳(メタデータ) (2020-04-14T08:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。