論文の概要: Machine Understanding of Scientific Language
- arxiv url: http://arxiv.org/abs/2506.23990v1
- Date: Mon, 30 Jun 2025 15:55:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.140239
- Title: Machine Understanding of Scientific Language
- Title(参考訳): 科学用語の機械的理解
- Authors: Dustin Wright,
- Abstract要約: この論文は、科学言語の機械的理解のためのデータセット、方法、ツールの育成に関するものである。
自然言語処理と機械学習の3分野 – 自動事実チェック,限定データによる学習,科学テキスト処理 – において,いくつかのコントリビューションを提示した。
- 参考スコア(独自算出の注目度): 3.094414120832024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific information expresses human understanding of nature. This knowledge is largely disseminated in different forms of text, including scientific papers, news articles, and discourse among people on social media. While important for accelerating our pursuit of knowledge, not all scientific text is faithful to the underlying science. As the volume of this text has burgeoned online in recent years, it has become a problem of societal importance to be able to identify the faithfulness of a given piece of scientific text automatically. This thesis is concerned with the cultivation of datasets, methods, and tools for machine understanding of scientific language, in order to analyze and understand science communication at scale. To arrive at this, I present several contributions in three areas of natural language processing and machine learning: automatic fact checking, learning with limited data, and scientific text processing. These contributions include new methods and resources for identifying check-worthy claims, adversarial claim generation, multi-source domain adaptation, learning from crowd-sourced labels, cite-worthiness detection, zero-shot scientific fact checking, detecting exaggerated scientific claims, and modeling degrees of information change in science communication. Critically, I demonstrate how the research outputs of this thesis are useful for effectively learning from limited amounts of scientific text in order to identify misinformative scientific statements and generate new insights into the science communication process
- Abstract(参考訳): 科学的情報は自然に対する人間の理解を表している。
この知識は、科学論文、ニュース記事、ソーシャルメディア上の人々の間での会話など、様々な形で散在している。
知識の追求を促進するために重要であるが、すべての科学文献が基礎となる科学に忠実であるわけではない。
近年, オンライン化が進み, 学術文献の忠実度を自動的に識別する社会的重要性が問題視されている。
この論文は、科学コミュニケーションを大規模に分析し理解するために、科学言語の機械的理解のためのデータセット、方法、ツールの育成に関するものである。
これに到達するために,自然言語処理と機械学習の3つの分野 – 自動事実チェック,限られたデータによる学習,科学テキスト処理 – にいくつかのコントリビューションを提示した。
これらの貢献には、チェック価値のあるクレームを識別するための新しい方法とリソース、敵対的クレーム生成、マルチソースドメイン適応、クラウドソースラベルからの学習、引用可能性の検出、ゼロショットの科学的事実チェック、誇張された科学的クレームの検出、科学コミュニケーションにおける情報変化の度合いのモデリングが含まれる。
批判的に、この論文のアウトプットが、誤形的科学的言明を識別し、科学コミュニケーションプロセスに新たな洞察をもたらすために、限られた科学文献から効果的に学習するのにどのように役立つかを実証する。
関連論文リスト
- ScienceMeter: Tracking Scientific Knowledge Updates in Language Models [79.33626657942169]
大規模言語モデル(LLM)は、科学研究を支援するためにますます使われているが、科学的進歩に関する彼らの知識は急速に時代遅れになる。
我々は,過去,現在,未来にまたがる科学的知識の更新手法を評価するための新しいフレームワークであるScienceMeterを紹介する。
論文 参考訳(メタデータ) (2025-05-30T07:28:20Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - SciTweets -- A Dataset and Annotation Framework for Detecting Scientific
Online Discourse [2.3371548697609303]
科学的な話題、主張、資源は、オンライン談話の一部としてますます議論されている。
これにより、社会的な影響が大きくなり、様々な分野からの科学的オンライン談話への関心が高まった。
専門分野にわたる研究は、現在、科学関連の様々な形態の堅牢な定義の欠如に悩まされている。
論文 参考訳(メタデータ) (2022-06-15T08:14:55Z) - An Informational Space Based Semantic Analysis for Scientific Texts [62.997667081978825]
本稿では、意味分析のための計算手法と、短い科学的テキストの意味の定量化について紹介する。
科学的意味の表現は、心理的特性ではなく、状況表現を置き換えることで標準化される。
本研究は,テキストの意味の幾何学的表現の基礎となる研究である。
論文 参考訳(メタデータ) (2022-05-31T11:19:32Z) - A Computational Inflection for Scientific Discovery [48.176406062568674]
我々は科学的な発見の軌跡において、かなりの屈折の足元に立っている。
社会が急速に成長するデジタルトランスフォーメーションを継続するにつれて、人類の集団的な科学的知識も同様である。
コンピュータ科学は科学プロセス自体に革命を起こそうとしている。
論文 参考訳(メタデータ) (2022-05-04T11:36:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。