論文の概要: Entity-based Claim Representation Improves Fact-Checking of Medical
Content in Tweets
- arxiv url: http://arxiv.org/abs/2209.07834v1
- Date: Fri, 16 Sep 2022 09:59:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-19 12:33:26.355021
- Title: Entity-based Claim Representation Improves Fact-Checking of Medical
Content in Tweets
- Title(参考訳): エンティティベースのクレーム表現は、ツイート中の医療内容のファクトチェッキングを改善する
- Authors: Amelie W\"uhrl and Roman Klinger
- Abstract要約: ソーシャルメディア上の偽の医療情報は、人々の健康に害を与える。
他のテキストジャンルのモデルは、トレーニングされた主張が実質的に異なるため、再利用可能なものではないかもしれない。
本稿では,確立したデータセットのクレーム特性を模倣するように,ソーシャルメディア入力を再構築することを提案する。
- 参考スコア(独自算出の注目度): 12.447379545167642
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: False medical information on social media poses harm to people's health.
While the need for biomedical fact-checking has been recognized in recent
years, user-generated medical content has received comparably little attention.
At the same time, models for other text genres might not be reusable, because
the claims they have been trained with are substantially different. For
instance, claims in the SciFact dataset are short and focused: "Side effects
associated with antidepressants increases risk of stroke". In contrast, social
media holds naturally-occurring claims, often embedded in additional context:
"`If you take antidepressants like SSRIs, you could be at risk of a condition
called serotonin syndrome' Serotonin syndrome nearly killed me in 2010. Had
symptoms of stroke and seizure." This showcases the mismatch between real-world
medical claims and the input that existing fact-checking systems expect. To
make user-generated content checkable by existing models, we propose to
reformulate the social-media input in such a way that the resulting claim
mimics the claim characteristics in established datasets. To accomplish this,
our method condenses the claim with the help of relational entity information
and either compiles the claim out of an entity-relation-entity triple or
extracts the shortest phrase that contains these elements. We show that the
reformulated input improves the performance of various fact-checking models as
opposed to checking the tweet text in its entirety.
- Abstract(参考訳): ソーシャルメディア上の偽の医療情報は、人々の健康に害を与える。
近年,バイオメディカルファクトチェックの必要性が認識されているが,利用者が生成した医療コンテンツの注目は少ない。
同時に、他のテキストジャンルのモデルは再利用可能なものではないかもしれない。
例えば、SciFactデータセットのクレームは短く集中しており、"抗うつ薬に関連する副作用は脳卒中リスクを増大させる"。
それとは対照的に、ソーシャルメディアには自然に発生する主張があり、「SSRIのような抗うつ薬を服用すれば、2010年にセロトニン症候群と呼ばれる症状が私をほぼ死なせる恐れがある」という追加の文脈に埋め込まれている。
これは、現実世界の医療請求と既存のファクトチェックシステムが期待する入力のミスマッチを示している。
既存のモデルでユーザ生成したコンテンツをチェックするために,既存のデータセットのクレーム特性を模倣するように,ソーシャルメディア入力を再構築することを提案する。
これを実現するために,本手法は関係エンティティ情報を用いてクレームを凝縮し,エンティティ・リレーション・エンタリティ三重項からクレームをコンパイルするか,あるいはこれらの要素を含む最短句を抽出する。
提案手法は,ツイートテキスト全体をチェックするのではなく,様々なファクトチェックモデルの性能を向上することを示す。
関連論文リスト
- Missci: Reconstructing Fallacies in Misrepresented Science [84.32990746227385]
ソーシャルネットワーク上の健康関連の誤報は、意思決定の貧弱さと現実世界の危険につながる可能性がある。
ミスシは、誤った推論のための新しい議論理論モデルである。
大規模言語モデルの批判的推論能力をテストするためのデータセットとしてMissciを提案する。
論文 参考訳(メタデータ) (2024-06-05T12:11:10Z) - Identifying and Aligning Medical Claims Made on Social Media with Medical Evidence [0.12277343096128711]
医療クレームの特定、これらのクレームからの医療語彙の抽出、特定された医療クレームに関連する証拠の検索という3つの中核課題について検討する。
本稿では,これらの中核的タスクをそれぞれ支援するために,合成医療クレームを生成できる新しいシステムを提案する。
論文 参考訳(メタデータ) (2024-05-18T07:50:43Z) - Towards Detecting Cascades of Biased Medical Claims on Twitter [1.7205106391379026]
われわれはTwitter上の偏見のある医療クレームを特定し、その拡散を測定する。
本稿では,医学的クレームを検出するRoBERTaとバイアスを分類するDistilBERTという2つのモデルを用いた機械学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T20:10:50Z) - An Entity-based Claim Extraction Pipeline for Real-world Biomedical
Fact-checking [10.536415845097661]
本稿では,名前付きエンティティ認識と,エンティティリンクによる用語正規化を組み込んだ医療ツイートのクレーム抽出パイプラインを提案する。
自動NERは金のアノテーションに比べて性能が低下するが, 事実チェック性能は変化しないツイートの入力よりも改善されている。
論文 参考訳(メタデータ) (2023-04-11T15:07:24Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - RedHOT: A Corpus of Annotated Medical Questions, Experiences, and Claims
on Social Media [1.5293427903448022]
我々はReddit Health Online Talk (RedHOT)を紹介します。
これらの主張の中で、患者の人口、インターベンション、アウトカム(PIO)を記述したスニペットをマークします。
そこで本研究では,高密度検索モデルの学習に使用するタスクの監視(ノイズ)を自動的に導出する手法を提案する。
論文 参考訳(メタデータ) (2022-10-12T15:50:32Z) - Monant Medical Misinformation Dataset: Mapping Articles to Fact-Checked
Claims [0.6927055673104934]
317kの医療ニュース記事/ブログと3.5kのファクトチェッククレームの特徴豊富なデータセットを公開しています。
また、手動で533件、クレームと記事のマッピングを51万件以上自動的にラベル付けしている。
このデータセットは、誤情報特徴化研究やソース間の誤情報拡散の研究など、医療的誤情報に関連する多くのタスクを可能にする。
論文 参考訳(メタデータ) (2022-04-26T13:18:27Z) - Unifying Relational Sentence Generation and Retrieval for Medical Image
Report Composition [142.42920413017163]
現在の手法は、個々のケースのデータセットバイアスにより、しばしば最も一般的な文を生成する。
テンプレート検索と文生成を一体化し、共通およびまれな異常に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T04:33:27Z) - Assessing the Severity of Health States based on Social Media Posts [62.52087340582502]
ユーザの健康状態の重症度を評価するために,テキストコンテンツとコンテキスト情報の両方をモデル化する多視点学習フレームワークを提案する。
多様なNLUビューは、ユーザの健康を評価するために、タスクと個々の疾患の両方に効果を示す。
論文 参考訳(メタデータ) (2020-09-21T03:45:14Z) - Misinformation Has High Perplexity [55.47422012881148]
疑似クレームを教師なしの方法でデバンクするために, 難易度を活用することを提案する。
まず,これらの主張に類似した文に基づいて,科学的およびニュースソースから信頼性のある証拠を抽出する。
第2に,抽出したエビデンスを言語モデルにプライマリし,難易度スコアに基づいて与えられたクレームの正当性を評価する。
論文 参考訳(メタデータ) (2020-06-08T15:13:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。