論文の概要: Utilizing Large Language Models to Identify Reddit Users Considering Vaping Cessation for Digital Interventions
- arxiv url: http://arxiv.org/abs/2404.17607v1
- Date: Thu, 25 Apr 2024 15:45:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 20:10:08.313661
- Title: Utilizing Large Language Models to Identify Reddit Users Considering Vaping Cessation for Digital Interventions
- Title(参考訳): 大規模言語モデルを用いたデジタル介入のためのバッピングセッセーションを考慮したRedditユーザ識別
- Authors: Sai Krishna Revanth Vuruma, Dezhi Wu, Saborny Sen Gupta, Lucas Aust, Valerie Lookingbill, Caleb Henry, Yang Ren, Erin Kasson, Li-Shiun Chen, Patricia Cavazos-Rehg, Dian Hu, Ming Huang,
- Abstract要約: 米国や他の国で電子タバコの使用や電子タバコの使用の人気が高まり、電子タバコが流行し、電子タバコの使用に伴う肺障害が発生している。
本研究では、Reddit上の1つの電子タバコサブコミュニティからサンプルデータセットを抽出し、ユーザの電子タバコの停止意図を分析した。
本研究は,最新のGPT-4と従来のBERTベースの言語モデルを含む大規模言語モデルを用いて,人間のアノテーションに対するこれらのモデルの結果を比較した。
- 参考スコア(独自算出の注目度): 1.134802802099004
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread adoption of social media platforms globally not only enhances users' connectivity and communication but also emerges as a vital channel for the dissemination of health-related information, thereby establishing social media data as an invaluable organic data resource for public health research. The surge in popularity of vaping or e-cigarette use in the United States and other countries has caused an outbreak of e-cigarette and vaping use-associated lung injury (EVALI), leading to hospitalizations and fatalities in 2019, highlighting the urgency to comprehend vaping behaviors and develop effective strategies for cession. In this study, we extracted a sample dataset from one vaping sub-community on Reddit to analyze users' quit vaping intentions. Leveraging large language models including both the latest GPT-4 and traditional BERT-based language models for sentence-level quit-vaping intention prediction tasks, this study compares the outcomes of these models against human annotations. Notably, when compared to human evaluators, GPT-4 model demonstrates superior consistency in adhering to annotation guidelines and processes, showcasing advanced capabilities to detect nuanced user quit-vaping intentions that human evaluators might overlook. These preliminary findings emphasize the potential of GPT-4 in enhancing the accuracy and reliability of social media data analysis, especially in identifying subtle users' intentions that may elude human detection.
- Abstract(参考訳): グローバルなソーシャルメディアプラットフォームの普及は、ユーザの接続性やコミュニケーションを高めるだけでなく、健康関連情報の拡散に欠かせないチャネルとして現れ、公衆衛生研究のための貴重な有機データ資源としてソーシャルメディアデータを確立する。
米国などの国々で電子タバコや電子タバコが普及し、電子タバコや電子タバコによる肺障害(EVALI)が流行し、2019年に入院と死亡が報告された。
本研究では、Reddit上の1つの電子タバコサブコミュニティからサンプルデータセットを抽出し、ユーザの電子タバコの停止意図を分析した。
本研究は,最新のGPT-4と従来のBERTベースの言語モデルを含む大規模言語モデルを用いて,人間のアノテーションに対するこれらのモデルの結果を比較した。
特に,GPT-4モデルは,ヒト評価者と比較して,ガイドラインやプロセスの適合性に優れた一貫性を示し,人間の評価者が見落としてしまうような,不注意なユーザ停止の意図を検出する高度な能力を示す。
これらの予備的な知見は、GPT-4がソーシャルメディアデータ分析の精度と信頼性を高める可能性、特に人間の検出を損なう可能性のある微妙なユーザの意図を識別する可能性を強調している。
関連論文リスト
- Public Health Advocacy Dataset: A Dataset of Tobacco Usage Videos from Social Media [6.9114339814002745]
Public Health Advocacy データセット (PHAD) は、TikTok や YouTube などのソーシャルメディアプラットフォームから提供されるタバコ製品に関連する5,730本のビデオの包括的なコレクションである。
このデータセットは430万フレームを含み、ユーザエンゲージメントメトリクス、ビデオ記述、検索キーワードなどの詳細なメタデータを含んでいる。
論文 参考訳(メタデータ) (2024-11-12T18:12:06Z) - MisinfoEval: Generative AI in the Era of "Alternative Facts" [50.069577397751175]
本稿では,大規模言語モデル(LLM)に基づく誤情報介入の生成と評価を行うフレームワークを提案する。
本研究では,(1)誤情報介入の効果を測定するための模擬ソーシャルメディア環境の実験,(2)ユーザの人口動態や信念に合わせたパーソナライズされた説明を用いた第2の実験について述べる。
以上の結果から,LSMによる介入はユーザの行動の修正に極めて有効であることが確認された。
論文 参考訳(メタデータ) (2024-10-13T18:16:50Z) - A Novel GAN Approach to Augment Limited Tabular Data for Short-Term Substance Use Prediction [10.490455676403974]
薬物使用者の短期的物質使用行動(PWUD)を正確に予測するための機械学習モデルの有用性が注目されている。
本稿では,米国大平原における258PWUDの縦断調査データを用いて,新しいGANを開発した。
以上の結果から,提案したGANの強化データを用いてトレーニングすると,マリファナ,メス,アンフェタミン,コカインの使用において,Aの13.4%,Bの15.8%の予測性能(AUROC)が向上することが示唆された。
論文 参考訳(メタデータ) (2024-07-17T23:03:24Z) - Can GPT-4 Help Detect Quit Vaping Intentions? An Exploration of Automatic Data Annotation Approach [1.134802802099004]
近年、アメリカ合衆国は電子タバコや電子タバコの普及が著しく進んでいるのを目撃している。
本研究では、Reddit上の1つの電子タバコサブコミュニティからサンプルデータセットを抽出し、ユーザの電子タバコの停止意図を分析した。
我々は, GPT-4にタスクを説明するために, 詳細レベルが異なる8つのプロンプトを開発した。
論文 参考訳(メタデータ) (2024-06-28T18:06:48Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Unveiling the Potential of Knowledge-Prompted ChatGPT for Enhancing Drug
Trafficking Detection on Social Media [30.791563171321062]
そこで本研究では,人間がLLMと対話し,その検出作業を行うためのインタフェースとして,emphknowledgeインフォームドプロンプトを構成するための分析フレームワークを提案する。
実験により,本フレームワークは薬物輸送検出精度において,他のベースライン言語モデルよりも優れていることが示された。
この研究がソーシャルネットワークにもたらした意味は、オンラインのセキュリティと公衆安全を改善するための分析ツールに事前知識とシナリオベースのプロンプトを組み込むことの重要性を強調している。
論文 参考訳(メタデータ) (2023-07-07T16:15:59Z) - Bridging the Gap: A Survey on Integrating (Human) Feedback for Natural
Language Generation [68.9440575276396]
この調査は、人間のフィードバックを利用して自然言語生成を改善した最近の研究の概要を提供することを目的としている。
まず、フィードバックの形式化を包括的に導入し、この形式化に続いて既存の分類学研究を特定・整理する。
第二に、フィードバックを形式や目的によってどのように記述するかを議論し、フィードバック(トレーニングやデコード)を直接使用したり、フィードバックモデルをトレーニングしたりするための2つのアプローチについて取り上げる。
第3に、AIフィードバックの生まれたばかりの分野の概要を紹介します。これは、大きな言語モデルを利用して、一連の原則に基づいて判断し、必要最小限にします。
論文 参考訳(メタデータ) (2023-05-01T17:36:06Z) - Increasing Adverse Drug Events extraction robustness on social media:
case study on negation and speculation [7.052238842788185]
過去10年間で、ソーシャルメディアプラットフォーム上でAdverse Drug Events(ADE)を報告するユーザーが増えている。
本稿では,ソーシャルメディア上でのADE検出のための4つの最先端システムについて考察する。
我々は,否定的および推測されたADEを含むサンプルに対して,それらの性能をテストするベンチマークであるSNAXを紹介する。
論文 参考訳(メタデータ) (2022-09-06T20:38:42Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - COVI White Paper [67.04578448931741]
接触追跡は、新型コロナウイルスのパンデミックの進行を変える上で不可欠なツールだ。
カナダで開発されたCovid-19の公衆ピアツーピア接触追跡とリスク認識モバイルアプリケーションであるCOVIの理論的、設計、倫理的考察、プライバシ戦略について概説する。
論文 参考訳(メタデータ) (2020-05-18T07:40:49Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。