論文の概要: HRDE: Retrieval-Augmented Large Language Models for Chinese Health Rumor Detection and Explainability
- arxiv url: http://arxiv.org/abs/2407.00668v2
- Date: Wed, 3 Jul 2024 15:18:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 12:55:43.678636
- Title: HRDE: Retrieval-Augmented Large Language Models for Chinese Health Rumor Detection and Explainability
- Title(参考訳): HRDE:中国における健康騒音の検出と説明可能性のための検索型大規模言語モデル
- Authors: Yanfang Chen, Ding Chen, Shichao Song, Simin Niu, Hanyu Wang, Zeyun Tang, Feiyu Xiong, Zhiyu Li,
- Abstract要約: 本稿では、一般的な健康関連質問のWebスクレイピングを通じて、12万件の健康関連噂(HealthRCN)を含むデータセットを構築する。
我々は,中国の健康噂の検出と説明可能性 (HRDE) のための検索強化された大規模言語モデルを提案する。
- 参考スコア(独自算出の注目度): 6.800433977880405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As people increasingly prioritize their health, the speed and breadth of health information dissemination on the internet have also grown. At the same time, the presence of false health information (health rumors) intermingled with genuine content poses a significant potential threat to public health. However, current research on Chinese health rumors still lacks a large-scale, public, and open-source dataset of health rumor information, as well as effective and reliable rumor detection methods. This paper addresses this gap by constructing a dataset containing 1.12 million health-related rumors (HealthRCN) through web scraping of common health-related questions and a series of data processing steps. HealthRCN is the largest known dataset of Chinese health information rumors to date. Based on this dataset, we propose retrieval-augmented large language models for Chinese health rumor detection and explainability (HRDE). This model leverages retrieved relevant information to accurately determine whether the input health information is a rumor and provides explanatory responses, effectively aiding users in verifying the authenticity of health information. In evaluation experiments, we compared multiple models and found that HRDE outperformed them all, including GPT-4-1106-Preview, in rumor detection accuracy and answer quality. HRDE achieved an average accuracy of 91.04% and an F1 score of 91.58%.
- Abstract(参考訳): 人々が健康を優先するようになり、インターネット上での健康情報の普及のスピードと広さも増している。
同時に、偽の健康情報(健康に関する噂)が本物のコンテンツと混同されることは、公衆衛生にとって大きな脅威となる。
しかし、中国の健康噂に関する現在の研究には、大規模な、公開され、オープンソースの健康噂情報のデータセットや、効果的で信頼性の高い噂検出方法がまだ欠けている。
本稿では、一般的な健康関連質問のWebスクレイピングと一連のデータ処理手順を通じて、1100万件の健康関連噂(HealthRCN)を含むデータセットを構築することで、このギャップに対処する。
HealthRCNは中国の健康情報に関する噂の最大のデータセットだ。
本データセットに基づいて,中国における健康噂の検出と説明可能性 (HRDE) のための検索強化された大規模言語モデルを提案する。
このモデルは、検索した関連情報を活用し、入力された健康情報が噂であるかどうかを正確に判定し、説明応答を提供し、ユーザの健康情報の信頼性検証を効果的に支援する。
評価実験では,複数のモデルを比較し,GPT-4-1106-Previewを含むHRDEが,噂検出精度と回答品質ですべてを上回る結果を得た。
HRDEの平均精度は91.04%、F1スコアは91.58%であった。
関連論文リスト
- Transforming Wearable Data into Health Insights using Large Language Model Agents [25.92023580781527]
本稿では,ウェアラブルの行動保健データを分析・解釈するエージェントシステムであるPersonal Health Insights Agent(PHIA)を紹介する。
650時間の人間と専門家による評価に基づいて、PHIAは事実の数値的な質問の84%以上と、クラウドソーシングされたオープンエンドな質問の83%以上に正確に対処することができる。
論文 参考訳(メタデータ) (2024-06-10T17:00:54Z) - Identifying Health Risks from Family History: A Survey of Natural Language Processing Techniques [10.121264712810616]
本研究では,家族性疾患のリスクを特定するために,デジタル健康記録を活用するために開発された技術について文献調査を行った。
ルールベースの手法は研究が盛んであり、現在も家族の歴史抽出に積極的に利用されている点を強調した。
より最近の取り組みは、大規模で事前訓練された言語モデルに基づくニューラルモデルの構築である。
論文 参考訳(メタデータ) (2024-03-15T03:43:07Z) - Health-LLM: Large Language Models for Health Prediction via Wearable Sensor Data [43.48422400822597]
大規模言語モデル(LLM)は多くの自然言語処理が可能であるが、完璧には程遠い。
本稿では、文脈情報に基づいて、健康に関する推測を行うLLMの能力について検討する。
本研究は,4つの公衆衛生データセットを用いた12種類のLCMの包括的評価と微調整技術について述べる。
論文 参考訳(メタデータ) (2024-01-12T19:40:11Z) - A Review on Knowledge Graphs for Healthcare: Resources, Applications,
and Promises [53.48844796428081]
この研究は、医療知識グラフ(HKG)の最初の包括的なレビューを提供する。
HKG構築のためのパイプラインと重要なテクニックを要約し、一般的な利用方法も示す。
アプリケーションレベルでは、さまざまなヘルスドメインにわたるHKGの正常な統合を検討します。
論文 参考訳(メタデータ) (2023-06-07T21:51:56Z) - COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。
また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。
我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文 参考訳(メタデータ) (2022-01-16T11:47:23Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - Know it to Defeat it: Exploring Health Rumor Characteristics and
Debunking Efforts on Chinese Social Media during COVID-19 Crisis [65.74516068984232]
われわれは、中国のマイクロブログサイトWeiboで、新型コロナウイルス(COVID-19)に関する4ヶ月にわたる噂に関するオンラインディスカッションを包括的に分析した。
以上の結果から、不安(恐怖)型健康噂は、希望(希望)型よりもはるかに多くの議論を巻き起こし、長く続いたことが示唆された。
本稿では,噂の議論を抑えるためのデバンキングの有効性を示す。
論文 参考訳(メタデータ) (2021-09-25T14:02:29Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Drink Bleach or Do What Now? Covid-HeRA: A Study of Risk-Informed Health
Decision Making in the Presence of COVID-19 Misinformation [23.449057978351945]
我々は健康上の誤報をリスクアセスメントのタスクとみなしている。
各誤報記事の重大さと読者がこの重大さをどう認識するかを考察する。
従来のモデルと最先端モデルを評価し、性能に大きなギャップがあることを示します。
論文 参考訳(メタデータ) (2020-10-17T08:34:57Z) - Assessing the Severity of Health States based on Social Media Posts [62.52087340582502]
ユーザの健康状態の重症度を評価するために,テキストコンテンツとコンテキスト情報の両方をモデル化する多視点学習フレームワークを提案する。
多様なNLUビューは、ユーザの健康を評価するために、タスクと個々の疾患の両方に効果を示す。
論文 参考訳(メタデータ) (2020-09-21T03:45:14Z) - Ginger Cannot Cure Cancer: Battling Fake Health News with a
Comprehensive Data Repository [40.76937321931461]
インターネット上で拡散している偽の健康ニュースは、公衆衛生にとって深刻な脅威となっている。
我々は、豊富な特徴を持つニュースコンテンツ、詳細な説明を含むニュースレビュー、ソーシャルエンゲージメント、ユーザー・ユーザー・ソーシャルネットワークを含む包括的リポジトリ、FakeHealthを構築した。
論文 参考訳(メタデータ) (2020-01-27T17:27:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。