Fugu-MT 論文翻訳(概要): Modeling Information Change in Science Communication with Semantically Matched Paraphrases

論文の概要: Modeling Information Change in Science Communication with Semantically Matched Paraphrases

arxiv url: http://arxiv.org/abs/2210.13001v1
Date: Mon, 24 Oct 2022 07:44:38 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-25 14:56:15.171502
Title: Modeling Information Change in Science Communication with Semantically Matched Paraphrases
Title（参考訳）: 意味的マッチングによる科学コミュニケーションにおける情報変化のモデル化
Authors: Dustin Wright and Jiaxin Pei and David Jurgens and Isabelle Augenstein
Abstract要約: SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。 SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。 SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
参考スコア（独自算出の注目度）: 50.67030449927206
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Whether the media faithfully communicate scientific information has long been a core issue to the science community. Automatically identifying paraphrased scientific findings could enable large-scale tracking and analysis of information changes in the science communication process, but this requires systems to understand the similarity between scientific information across multiple domains. To this end, we present the SCIENTIFIC PARAPHRASE AND INFORMATION CHANGE DATASET (SPICED), the first paraphrase dataset of scientific findings annotated for degree of information change. SPICED contains 6,000 scientific finding pairs extracted from news stories, social media discussions, and full texts of original papers. We demonstrate that SPICED poses a challenging task and that models trained on SPICED improve downstream performance on evidence retrieval for fact checking of real-world scientific claims. Finally, we show that models trained on SPICED can reveal large-scale trends in the degrees to which people and organizations faithfully communicate new scientific findings. Data, code, and pre-trained models are available at http://www.copenlu.com/publication/2022_emnlp_wright/.
Abstract（参考訳）: メディアが科学的情報を忠実に伝えるかどうかは、長い間科学コミュニティにとって重要な問題だった。パラフレーズの科学的発見を自動的に特定することで、科学コミュニケーションプロセスにおける情報変化の大規模追跡と分析が可能になるが、複数の領域にわたる科学情報間の類似性をシステムが理解する必要がある。そこで本研究では,情報変更の程度に注釈が付された最初の科学的発見のパラフレーズデータセットであるspiced(scientific paraphrase and information change dataset)を提案する。 SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。我々は,SPICEDが課題であり,SPICEDで訓練されたモデルが実世界の科学的主張の事実確認のための証拠検索における下流性能を向上させることを実証した。最後に、SPICEDで訓練されたモデルが、人や組織が新しい科学的発見を忠実に伝達する程度に、大規模な傾向を示すことを示す。データ、コード、事前訓練されたモデルはhttp://www.copenlu.com/publication/2022_emnlp_wright/で入手できる。

関連論文リスト

WildSci: Advancing Scientific Reasoning from In-the-Wild Literature [50.16160754134139]
我々は、ピアレビューされた文献から自動的に合成されるドメイン固有の科学質問の新しいデータセットWildSciを紹介する。複雑な科学的推論タスクを複数選択形式でフレーミングすることにより、明確に定義された報酬信号によるスケーラブルなトレーニングを可能にする。一連の科学的ベンチマークの実験は、我々のデータセットとアプローチの有効性を実証している。
論文参考訳（メタデータ） (2026-01-09T06:35:23Z)
A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文参考訳（メタデータ） (2025-08-28T18:30:52Z)
Machine Understanding of Scientific Language [3.094414120832024]
この論文は、科学言語の機械的理解のためのデータセット、方法、ツールの育成に関するものである。自然言語処理と機械学習の3分野 – 自動事実チェック,限定データによる学習,科学テキスト処理 – において,いくつかのコントリビューションを提示した。
論文参考訳（メタデータ） (2025-06-30T15:55:10Z)
Modeling Public Perceptions of Science in Media [49.096529873255385]
本稿では,ニュースの持続性,重要度,驚き度など,12次元にわたる公的な認識をモデル化する計算フレームワークを提案する。我々は、米国と英国の多様な人口から2,101人の参加者から10,489のアノテーションで、大規模な科学ニュースの認識データセットを作成します。我々は,公共の知覚スコアを高い性能で予測するNLPモデルを開発した。
論文参考訳（メタデータ） (2025-06-19T21:49:28Z)
ScienceMeter: Tracking Scientific Knowledge Updates in Language Models [79.33626657942169]
大規模言語モデル(LLM)は、科学研究を支援するためにますます使われているが、科学的進歩に関する彼らの知識は急速に時代遅れになる。我々は,過去,現在,未来にまたがる科学的知識の更新手法を評価するための新しいフレームワークであるScienceMeterを紹介する。
論文参考訳（メタデータ） (2025-05-30T07:28:20Z)
SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文参考訳（メタデータ） (2024-06-20T22:03:21Z)
A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文参考訳（メタデータ） (2024-06-16T08:03:24Z)
LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文参考訳（メタデータ） (2024-05-16T03:04:10Z)
Can Large Language Models Detect Misinformation in Scientific News Reporting? [1.0344642971058586]
本稿では,科学的報告における誤情報の検出に大規模言語モデル(LLM)を用いることが可能であるかを検討する。最初にラベル付きデータセットSciNewsを提示し、信頼できない情報源から抜粋された2.4万の科学ニュース記事を含む。科学ニュース記事の科学的妥当性の次元を識別し、科学的誤報の自動検出にどのように組み込むかを検討する。
論文参考訳（メタデータ） (2024-02-22T04:07:00Z)
Understanding Fine-grained Distortions in Reports of Scientific Findings [46.96512578511154]
歪んだ科学コミュニケーションは、不健康な行動の変化を招き、科学機関の信頼を低下させる可能性があるため、個人や社会に害を与える。近年の科学コミュニケーションの増大を考えると、科学出版物からの発見が一般大衆にどのように報告されるかについて、きめ細かい理解が不可欠である。
論文参考訳（メタデータ） (2024-02-19T19:00:01Z)
SciTweets -- A Dataset and Annotation Framework for Detecting Scientific Online Discourse [2.3371548697609303]
科学的な話題、主張、資源は、オンライン談話の一部としてますます議論されている。これにより、社会的な影響が大きくなり、様々な分野からの科学的オンライン談話への関心が高まった。専門分野にわたる研究は、現在、科学関連の様々な形態の堅牢な定義の欠如に悩まされている。
論文参考訳（メタデータ） (2022-06-15T08:14:55Z)
A Computational Inflection for Scientific Discovery [48.176406062568674]
我々は科学的な発見の軌跡において、かなりの屈折の足元に立っている。社会が急速に成長するデジタルトランスフォーメーションを継続するにつれて、人類の集団的な科学的知識も同様である。コンピュータ科学は科学プロセス自体に革命を起こそうとしている。
論文参考訳（メタデータ） (2022-05-04T11:36:54Z)
Semi-Supervised Exaggeration Detection of Health Science Press Releases [23.930041685595775]
近年の研究では、研究結果を誇張することで、メディアが科学論文を誤って表現する傾向が示されている。本稿では,科学コミュニケーションにおける誇張検出問題の形式化と研究について述べる。本稿では,補完的なクローゼスタイルのQAタスクからの知識を活用し,数発の学習を改善する多タスク版であるMT-PETを紹介する。
論文参考訳（メタデータ） (2021-08-30T19:32:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。