Fugu-MT 論文翻訳(概要): HRDE: Retrieval-Augmented Large Language Models for Chinese Health Rumor Detection and Explainability

論文の概要: HRDE: Retrieval-Augmented Large Language Models for Chinese Health Rumor Detection and Explainability

arxiv url: http://arxiv.org/abs/2407.00668v1
Date: Sun, 30 Jun 2024 11:27:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-04 02:07:11.766607
Title: HRDE: Retrieval-Augmented Large Language Models for Chinese Health Rumor Detection and Explainability
Title（参考訳）: HRDE:中国における健康騒音の検出と説明可能性のための検索型大規模言語モデル
Authors: Yanfang Chen, Ding Chen, Shichao Song, Simin Niu, Hanyu Wang, Zeyun Tang, Feiyu Xiong, Zhiyu Li,
Abstract要約: 本稿では、一般的な健康関連質問のWebスクレイピングを通じて、12万件の健康関連噂(HealthRCN)を含むデータセットを構築する。我々は,中国の健康噂の検出と説明可能性 (HRDE) のための検索強化された大規模言語モデルを提案する。
参考スコア（独自算出の注目度）: 6.800433977880405
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: As people increasingly prioritize their health, the speed and breadth of health information dissemination on the internet have also grown. At the same time, the presence of false health information (health rumors) intermingled with genuine content poses a significant potential threat to public health. However, current research on Chinese health rumors still lacks a large-scale, public, and open-source dataset of health rumor information, as well as effective and reliable rumor detection methods. This paper addresses this gap by constructing a dataset containing 1.12 million health-related rumors (HealthRCN) through web scraping of common health-related questions and a series of data processing steps. HealthRCN is the largest known dataset of Chinese health information rumors to date. Based on this dataset, we propose retrieval-augmented large language models for Chinese health rumor detection and explainability (HRDE). This model leverages retrieved relevant information to accurately determine whether the input health information is a rumor and provides explanatory responses, effectively aiding users in verifying the authenticity of health information. In evaluation experiments, we compared multiple models and found that HRDE outperformed them all, including GPT-4-1106-Preview, in rumor detection accuracy and answer quality. HRDE achieved an average accuracy of 91.04% and an F1 score of 91.58%.
Abstract（参考訳）: 人々が健康を優先するようになり、インターネット上での健康情報の普及のスピードと広さも増している。同時に、偽の健康情報(健康に関する噂)が本物のコンテンツと混同されることは、公衆衛生にとって大きな脅威となる。しかし、中国の健康噂に関する現在の研究には、大規模な、公開され、オープンソースの健康噂情報のデータセットや、効果的で信頼性の高い噂検出方法がまだ欠けている。本稿では、一般的な健康関連質問のWebスクレイピングと一連のデータ処理手順を通じて、1100万件の健康関連噂(HealthRCN)を含むデータセットを構築することで、このギャップに対処する。 HealthRCNは中国の健康情報に関する噂の最大のデータセットだ。本データセットに基づいて,中国における健康噂の検出と説明可能性 (HRDE) のための検索強化された大規模言語モデルを提案する。このモデルは、検索した関連情報を活用し、入力された健康情報が噂であるかどうかを正確に判定し、説明応答を提供し、ユーザの健康情報の信頼性検証を効果的に支援する。評価実験では,複数のモデルを比較し,GPT-4-1106-Previewを含むHRDEが,噂検出精度と回答品質ですべてを上回る結果を得た。 HRDEの平均精度は91.04%、F1スコアは91.58%であった。

関連論文リスト

Large Language Models' Varying Accuracy in Recognizing Risk-Promoting and Health-Supporting Sentiments in Public Health Discourse: The Cases of HPV Vaccination and Heated Tobacco Products [2.0618817976970103]
大規模言語モデル(LLM)は強力な技術として注目されているが、その正確さと、健康問題に対するさまざまな意見の収集の可能性はほとんど解明されていない。本研究は、リスク促進と健康支援の感情を検出する上で、3つの顕著なLSMがどの程度正確かを検討する。特に、モデルはFacebook上でリスク促進感情の精度が高く、Twitter上でのヘルスサポートメッセージはより正確に検出される。
論文参考訳（メタデータ） (2025-07-06T11:57:02Z)
From Generation to Detection: A Multimodal Multi-Task Dataset for Benchmarking Health Misinformation [40.226443705818404]
本稿では,34,746のニュース記事からなる健康領域における大規模マルチモーダル誤報データセットであるMM Healthについて紹介する。 MM Healthには、さまざまなSOTA生成AIモデルから生成された、人間生成のマルチモーダル情報(5,776記事)とAI生成のマルチモーダル情報(28,880記事)が含まれている。
論文参考訳（メタデータ） (2025-05-24T13:04:23Z)
TrumorGPT: Graph-Based Retrieval-Augmented Large Language Model for Fact-Checking [2.3704813250344436]
TrumorGPTは、健康領域におけるファクトチェックのために設計された、新しい生成人工知能ソリューションである。これは、健康に関する噂が本当だと判明した「噂」を区別することを目的としている。 TrumorGPTにはグラフベースの検索拡張生成(GraphRAG)が組み込まれている。
論文参考訳（メタデータ） (2025-05-11T17:00:21Z)
Do LLMs Provide Consistent Answers to Health-Related Questions across Languages? [14.87110905165928]
英語,ドイツ語,トルコ語,中国語の健康問題に対するLarge Language Models (LLMs) による回答の整合性を検討した。医療の誤報を広める可能性のある反応の重大な矛盾を明らかにした。本研究は, 正確で公平な医療情報を確保するために, 言語間アライメントの改善の必要性を強調した。
論文参考訳（メタデータ） (2025-01-24T18:51:26Z)
CHBench: A Chinese Dataset for Evaluating Health in Large Language Models [19.209493319541693]
中国初の総合保健関連ベンチマークであるCHBenchを紹介する。 CHBenchには、メンタルヘルスに関連する6,493のエントリと、身体健康に焦点を当てた2,999のエントリが含まれている。このデータセットは、正確な健康関連情報を理解し、生成する中国のLCMの能力を評価する基盤となる。
論文参考訳（メタデータ） (2024-09-24T05:44:46Z)
Transforming Wearable Data into Health Insights using Large Language Model Agents [25.92023580781527]
本稿では,ウェアラブルの行動保健データを分析・解釈するエージェントシステムであるPersonal Health Insights Agent(PHIA)を紹介する。 650時間の人間と専門家による評価に基づいて、PHIAは事実の数値的な質問の84%以上と、クラウドソーシングされたオープンエンドな質問の83%以上に正確に対処することができる。
論文参考訳（メタデータ） (2024-06-10T17:00:54Z)
Health-LLM: Large Language Models for Health Prediction via Wearable Sensor Data [43.48422400822597]
大規模言語モデル(LLM)は多くの自然言語処理が可能であるが、完璧には程遠い。本稿では、文脈情報に基づいて、健康に関する推測を行うLLMの能力について検討する。本研究は,4つの公衆衛生データセットを用いた12種類のLCMの包括的評価と微調整技術について述べる。
論文参考訳（メタデータ） (2024-01-12T19:40:11Z)
A Review on Knowledge Graphs for Healthcare: Resources, Applications, and Promises [52.31710895034573]
この研究は、医療知識グラフ(HKG)の最初の包括的なレビューを提供する。 HKG構築のためのパイプラインと重要なテクニックを要約し、一般的な利用方法も示す。アプリケーションレベルでは、さまざまなヘルスドメインにわたるHKGの正常な統合を検討します。
論文参考訳（メタデータ） (2023-06-07T21:51:56Z)
RoS-KD: A Robust Stochastic Knowledge Distillation Approach for Noisy Medical Imaging [67.02500668641831]
ノイズの多いデータセットでトレーニングされたディープラーニングモデルは、ノイズタイプに敏感であり、目に見えないサンプルの一般化が少なくなる。本稿では,複数の情報源からトピックを学習する概念を模倣したロバスト知識蒸留(RoS-KD)フレームワークを提案する。 RoS-KDは、訓練データの重複する部分集合について訓練された複数の教師から知識を蒸留することにより、滑らかで、よく表現された、堅牢な学生多様体を学習する。
論文参考訳（メタデータ） (2022-10-15T22:32:20Z)
COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文参考訳（メタデータ） (2022-01-16T11:47:23Z)
Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文参考訳（メタデータ） (2021-10-13T04:44:02Z)
Know it to Defeat it: Exploring Health Rumor Characteristics and Debunking Efforts on Chinese Social Media during COVID-19 Crisis [65.74516068984232]
われわれは、中国のマイクロブログサイトWeiboで、新型コロナウイルス(COVID-19)に関する4ヶ月にわたる噂に関するオンラインディスカッションを包括的に分析した。以上の結果から、不安(恐怖)型健康噂は、希望(希望)型よりもはるかに多くの議論を巻き起こし、長く続いたことが示唆された。本稿では,噂の議論を抑えるためのデバンキングの有効性を示す。
論文参考訳（メタデータ） (2021-09-25T14:02:29Z)
UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。 UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。 UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文参考訳（メタデータ） (2020-10-22T02:28:11Z)
Drink Bleach or Do What Now? Covid-HeRA: A Study of Risk-Informed Health Decision Making in the Presence of COVID-19 Misinformation [23.449057978351945]
我々は健康上の誤報をリスクアセスメントのタスクとみなしている。各誤報記事の重大さと読者がこの重大さをどう認識するかを考察する。従来のモデルと最先端モデルを評価し、性能に大きなギャップがあることを示します。
論文参考訳（メタデータ） (2020-10-17T08:34:57Z)
Assessing the Severity of Health States based on Social Media Posts [62.52087340582502]
ユーザの健康状態の重症度を評価するために,テキストコンテンツとコンテキスト情報の両方をモデル化する多視点学習フレームワークを提案する。多様なNLUビューは、ユーザの健康を評価するために、タスクと個々の疾患の両方に効果を示す。
論文参考訳（メタデータ） (2020-09-21T03:45:14Z)
Ginger Cannot Cure Cancer: Battling Fake Health News with a Comprehensive Data Repository [40.76937321931461]
インターネット上で拡散している偽の健康ニュースは、公衆衛生にとって深刻な脅威となっている。我々は、豊富な特徴を持つニュースコンテンツ、詳細な説明を含むニュースレビュー、ソーシャルエンゲージメント、ユーザー・ユーザー・ソーシャルネットワークを含む包括的リポジトリ、FakeHealthを構築した。
論文参考訳（メタデータ） (2020-01-27T17:27:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。