論文の概要: An Entity-based Claim Extraction Pipeline for Real-world Biomedical
Fact-checking
- arxiv url: http://arxiv.org/abs/2304.05268v1
- Date: Tue, 11 Apr 2023 15:07:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 14:36:43.762077
- Title: An Entity-based Claim Extraction Pipeline for Real-world Biomedical
Fact-checking
- Title(参考訳): 実世界バイオメディカルファクトチェックのためのエンティティベースのクレーム抽出パイプライン
- Authors: Amelie W\"uhrl, Lara Grimminger, Roman Klinger
- Abstract要約: 本稿では,名前付きエンティティ認識と,エンティティリンクによる用語正規化を組み込んだ医療ツイートのクレーム抽出パイプラインを提案する。
自動NERは金のアノテーションに比べて性能が低下するが, 事実チェック性能は変化しないツイートの入力よりも改善されている。
- 参考スコア(独自算出の注目度): 10.536415845097661
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Existing fact-checking models for biomedical claims are typically trained on
synthetic or well-worded data and hardly transfer to social media content. This
mismatch can be mitigated by adapting the social media input to mimic the
focused nature of common training claims. To do so, Wuehrl & Klinger (2022)
propose to extract concise claims based on medical entities in the text.
However, their study has two limitations: First, it relies on gold-annotated
entities. Therefore, its feasibility for a real-world application cannot be
assessed since this requires detecting relevant entities automatically. Second,
they represent claim entities with the original tokens. This constitutes a
terminology mismatch which potentially limits the fact-checking performance. To
understand both challenges, we propose a claim extraction pipeline for medical
tweets that incorporates named entity recognition and terminology normalization
via entity linking. We show that automatic NER does lead to a performance drop
in comparison to using gold annotations but the fact-checking performance still
improves considerably over inputting the unchanged tweets. Normalizing entities
to their canonical forms does, however, not improve the performance.
- Abstract(参考訳): 既存のバイオメディカルクレームのファクトチェックモデルは、一般的に合成データやよく表現されたデータに基づいて訓練され、ソーシャルメディアのコンテンツにはほとんど転送されない。
このミスマッチは、ソーシャルメディアの入力を、共通のトレーニングクレームの焦点を合わせた性質に適応させることで軽減することができる。
そのために、Wuehrl & Klinger (2022) は、テキスト中の医療機関に基づく簡潔なクレームの抽出を提案している。
しかし、彼らの研究には2つの制限がある。
したがって、現実世界のアプリケーションに対するその実現性は、自動的に関連エンティティを検出する必要があるため、評価できない。
第二に、クレームエンティティを元のトークンで表現する。
これは、ファクトチェックのパフォーマンスを制限する用語ミスマッチを構成する。
両者の課題を理解するために,名前付きエンティティ認識とエンティティリンクによる用語正規化を組み込んだ医療ツイートのクレーム抽出パイプラインを提案する。
自動NERは金のアノテーションに比べて性能が低下するが,事実チェック性能は変化しないツイートの入力よりも改善されている。
しかし、エンティティを標準形式に正規化しても、パフォーマンスは向上しない。
関連論文リスト
- What Makes Medical Claims (Un)Verifiable? Analyzing Entity and Relation
Properties for Fact Verification [8.086400003948143]
BEAR-Factコーパス(BEAR-Fact corpus)は、科学的事実検証のための最初のコーパスである。
クレームテキストから純粋に証拠検索の成功を確実に推定できることを示す。
データセットはhttp://www.ims.uni-stuttgart.de/data/bioclaimで公開されている。
論文 参考訳(メタデータ) (2024-02-02T12:27:58Z) - From Chaos to Clarity: Claim Normalization to Empower Fact-Checking [57.024192702939736]
Claim Normalization(別名 ClaimNorm)は、複雑でノイズの多いソーシャルメディア投稿を、より単純で分かりやすい形式に分解することを目的としている。
本稿では,チェーン・オブ・ソートとクレーム・チェック・バシネス推定を利用した先駆的アプローチであるCACNを提案する。
実験により, CACNは様々な評価尺度において, いくつかの基準値を上回る性能を示した。
論文 参考訳(メタデータ) (2023-10-22T16:07:06Z) - Partial Annotation Learning for Biomedical Entity Recognition [0.19336815376402716]
部分的アノテーション学習法は, 実体アノテーションの欠如により, バイオメディカルコーパスから効果的に学習できることが示唆された。
提案手法は代替品よりも優れており,特にPubMedBERTタグをF1スコアで38%向上させる。
論文 参考訳(メタデータ) (2023-05-22T15:18:38Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Entity-based Claim Representation Improves Fact-Checking of Medical
Content in Tweets [12.447379545167642]
ソーシャルメディア上の偽の医療情報は、人々の健康に害を与える。
他のテキストジャンルのモデルは、トレーニングされた主張が実質的に異なるため、再利用可能なものではないかもしれない。
本稿では,確立したデータセットのクレーム特性を模倣するように,ソーシャルメディア入力を再構築することを提案する。
論文 参考訳(メタデータ) (2022-09-16T09:59:22Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Claim Detection in Biomedical Twitter Posts [11.335643770130238]
生体医学に関する誤った情報は特に危険である。
我々は、この研究ギャップを埋め、暗黙的かつ明示的なバイオメディカルクレームのために1200ツイートのコーパスに注釈を付けることを目指している。
クレームを含むツイートを自動的に検出するベースラインモデルを開発。
論文 参考訳(メタデータ) (2021-04-23T14:45:31Z) - Fast and Effective Biomedical Entity Linking Using a Dual Encoder [48.86736921025866]
文書中の複数の言及を1ショットで解決するBERTベースのデュアルエンコーダモデルを提案する。
本稿では,提案モデルが既存のBERTモデルよりも複数倍高速であり,バイオメディカルエンティティリンクの精度に競争力があることを示す。
論文 参考訳(メタデータ) (2021-03-08T19:32:28Z) - Generating Fact Checking Explanations [52.879658637466605]
まだ欠けているパズルの重要なピースは、プロセスの最も精巧な部分を自動化する方法を理解することです。
本稿では、これらの説明を利用可能なクレームコンテキストに基づいて自動生成する方法について、最初の研究を行う。
この結果から,個別に学習するのではなく,両目標を同時に最適化することで,事実確認システムの性能が向上することが示唆された。
論文 参考訳(メタデータ) (2020-04-13T05:23:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。