論文の概要: SciEv: Finding Scientific Evidence Papers for Scientific News
- arxiv url: http://arxiv.org/abs/2205.00126v1
- Date: Sat, 30 Apr 2022 01:43:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 16:09:31.130322
- Title: SciEv: Finding Scientific Evidence Papers for Scientific News
- Title(参考訳): SciEv:科学ニュースのための科学的エビデンス論文を見つける
- Authors: Md Reshad Ul Hoque, Jiang Li, Jian Wu
- Abstract要約: 我々はSciEvと呼ばれる科学論文を科学ニュース記事から検索するシステムを提案する。
SciEvの重要な特徴は、ドメイン知識エンティティ(DKE)を使用して、第1段階の候補を見つけることである。
本システムを評価するため,ScienceAlertなどのWebサイトから,手作業で編集した100組のペア(新製,紙製)からなるパイロットデータセットを作成した。
- 参考スコア(独自算出の注目度): 5.6164173936437045
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the past decade, many scientific news media that report scientific
breakthroughs and discoveries emerged, bringing science and technology closer
to the general public. However, not all scientific news article cites proper
sources, such as original scientific papers. A portion of scientific news
articles contain misinterpreted, exaggerated, or distorted information that
deviates from facts asserted in the original papers. Manually identifying
proper citations is laborious and costly. Therefore, it is necessary to
automatically search for pertinent scientific papers that could be used as
evidence for a given piece of scientific news. We propose a system called SciEv
that searches for scientific evidence papers given a scientific news article.
The system employs a 2-stage query paradigm with the first stage retrieving
candidate papers and the second stage reranking them. The key feature of SciEv
is it uses domain knowledge entities (DKEs) to find candidates in the first
stage, which proved to be more effective than regular keyphrases. In the
reranking stage, we explore different document representations for news
articles and candidate papers. To evaluate our system, we compiled a pilot
dataset consisting of 100 manually curated (news,paper) pairs from ScienceAlert
and similar websites. To our best knowledge, this is the first dataset of this
kind. Our experiments indicate that the transformer model performs the best for
DKE extraction. The system achieves a P@1=50%, P@5=71%, and P@10=74% when it
uses a TFIDF-based text representation. The transformer-based re-ranker
achieves a comparable performance but costs twice as much time. We will collect
more data and test the system for user experience.
- Abstract(参考訳): 過去10年間、科学のブレークスルーや発見を報告する多くの科学ニュースメディアが登場し、科学とテクノロジーが一般に普及した。
しかし、すべての科学記事が、オリジナルの科学論文のような適切な情報源を引用しているわけではない。
科学ニュース記事の一部は、元の論文で主張された事実から逸脱した誤解、誇張、または歪んだ情報を含んでいる。
適切な引用を手動で識別するのは手間とコストがかかる。
したがって、特定の科学的ニュースの証拠として使用できる、関連する科学論文を自動的に検索する必要がある。
我々はSciEvと呼ばれる科学論文を科学ニュース記事から検索するシステムを提案する。
システムは2段階の問合せパラダイムを採用し、第1段階は候補論文を検索し、第2段階はそれらを再ランク付けする。
SciEvの重要な特徴は、ドメイン知識エンティティ(DKEs)を使用して、最初の段階で候補を見つけることである。
更新段階では,新聞記事や候補者論文の異なる文書表現について検討する。
本システムを評価するために,sciencealertおよび類似のwebサイトから100組の手動キュレーション(ニュース,ペーパー)ペアからなるパイロットデータセットをコンパイルした。
私たちの知る限りでは、この種のデータセットはこれが初めてです。
本実験は, トランスモデルがDKE抽出に最適であることを示す。
TFIDFベースのテキスト表現を使用すると、P@1=50%、P@5=71%、P@10=74%が得られる。
トランスフォーマーベースのリランカは同等のパフォーマンスを実現するが、コストは2倍である。
より多くのデータを収集し、ユーザー体験のためにシステムをテストします。
関連論文リスト
- SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。
コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文 参考訳(メタデータ) (2024-06-20T22:03:21Z) - Can Large Language Models Detect Misinformation in Scientific News
Reporting? [1.0344642971058586]
本稿では,科学的報告における誤情報の検出に大規模言語モデル(LLM)を用いることが可能であるかを検討する。
最初にラベル付きデータセットSciNewsを提示し、信頼できない情報源から抜粋された2.4万の科学ニュース記事を含む。
科学ニュース記事の科学的妥当性の次元を識別し、科学的誤報の自動検出にどのように組み込むかを検討する。
論文 参考訳(メタデータ) (2024-02-22T04:07:00Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - SciFact-Open: Towards open-domain scientific claim verification [61.288725621156864]
本稿では,科学的クレーム検証システムの性能評価を目的とした新しいテストコレクションであるSciFact-Openを提案する。
我々は、4つの最先端の科学的クレーム検証モデルの上位予測をプールし、注釈付けすることで、科学的クレームの証拠を収集する。
その結果,SciFact-Openへの一般化に苦慮する小形コーパス上で開発されたシステムは,少なくとも15F1の性能低下を示すことがわかった。
論文 参考訳(メタデータ) (2022-10-25T05:45:00Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - SciClops: Detecting and Contextualizing Scientific Claims for Assisting
Manual Fact-Checking [7.507186058512835]
本稿では,オンライン科学の誤報に対処する手法であるSciClopsについて述べる。
SciClopsは、オンラインニュース記事やソーシャルメディア投稿に見られる科学的主張を処理するための3つの主要なステップを含んでいる。
複雑な科学的クレームの検証において、非専門家のファクトチェックを効果的に支援し、商業的なファクトチェックシステムより優れている。
論文 参考訳(メタデータ) (2021-10-25T16:35:58Z) - Semi-Supervised Exaggeration Detection of Health Science Press Releases [23.930041685595775]
近年の研究では、研究結果を誇張することで、メディアが科学論文を誤って表現する傾向が示されている。
本稿では,科学コミュニケーションにおける誇張検出問題の形式化と研究について述べる。
本稿では,補完的なクローゼスタイルのQAタスクからの知識を活用し,数発の学習を改善する多タスク版であるMT-PETを紹介する。
論文 参考訳(メタデータ) (2021-08-30T19:32:20Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Fact or Fiction: Verifying Scientific Claims [53.29101835904273]
本稿では,研究文献から,REFUTESやREFUTESが与えられた科学的主張であることを示す証拠を含む抄録を抽出する新たな課題である,科学的クレーム検証を紹介する。
SciFactは、1.4Kの専門家による科学的主張と、ラベルや合理性に注釈を付けたエビデンスを含む抽象概念を組み合わせたデータセットである。
このシステムは,CORD-19コーパスの証拠を同定することにより,新型コロナウイルス関連クレームを検証可能であることを示す。
論文 参考訳(メタデータ) (2020-04-30T17:22:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。