論文の概要: Identifying causal associations in tweets using deep learning: Use case
on diabetes-related tweets from 2017-2021
- arxiv url: http://arxiv.org/abs/2111.01225v1
- Date: Mon, 1 Nov 2021 19:25:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 12:44:19.735629
- Title: Identifying causal associations in tweets using deep learning: Use case
on diabetes-related tweets from 2017-2021
- Title(参考訳): ディープラーニングを用いたツイートの因果関係の同定--2017-2021年の糖尿病関連ツイートを事例として
- Authors: Adrian Ahne (1 and 2), Vivek Khetan (3), Xavier Tannier (4), Md
Imbessat Hassan Rizvi (5), Thomas Czernichow (2), Francisco Orchard (2),
Charline Bour (6), Andrew Fano (3), Guy Fagherazzi (6) ((1) Paris-Saclay
University, UVSQ, Inserm, Gustave Roussy, Exposome and Heredity team, CESP,
F-94805, Villejuif, France, (2) Epiconcept, Paris, France, (3) Accenture
Labs, San Francisco, USA, (4) Sorbonne University, Inserm, University
Sorbonne Paris Nord, Laboratoire d'Informatique Medicale et d'Ingenierie des
Connaissances pour la e-Sante, LIMICS, Paris, France, (5) Indian Institute of
Science, Bengaluru, India, (6) Deep Digital Phenotyping Research Unit,
Department of Precision Health, Luxembourg Institute of Health, Strassen,
Luxembourg)
- Abstract要約: 本研究の目的は,糖尿病関連ツイートの明示的および暗黙的な因果関係を抽出することである。
2017年4月から2021年1月にかけて、英語で3000万以上の糖尿病関連ツイートが収集された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Objective: Leveraging machine learning methods, we aim to extract both
explicit and implicit cause-effect associations in patient-reported,
diabetes-related tweets and provide a tool to better understand opinion,
feelings and observations shared within the diabetes online community from a
causality perspective. Materials and Methods: More than 30 million
diabetes-related tweets in English were collected between April 2017 and
January 2021. Deep learning and natural language processing methods were
applied to focus on tweets with personal and emotional content. A
cause-effect-tweet dataset was manually labeled and used to train 1) a
fine-tuned Bertweet model to detect causal sentences containing a causal
association 2) a CRF model with BERT based features to extract possible
cause-effect associations. Causes and effects were clustered in a
semi-supervised approach and visualised in an interactive cause-effect-network.
Results: Causal sentences were detected with a recall of 68% in an imbalanced
dataset. A CRF model with BERT based features outperformed a fine-tuned BERT
model for cause-effect detection with a macro recall of 68%. This led to 96,676
sentences with cause-effect associations. "Diabetes" was identified as the
central cluster followed by "Death" and "Insulin". Insulin pricing related
causes were frequently associated with "Death". Conclusions: A novel
methodology was developed to detect causal sentences and identify both explicit
and implicit, single and multi-word cause and corresponding effect as expressed
in diabetes-related tweets leveraging BERT-based architectures and visualised
as cause-effect-network. Extracting causal associations on real-life, patient
reported outcomes in social media data provides a useful complementary source
of information in diabetes research.
- Abstract(参考訳): 目的: 糖尿病関連ツイートにおける明示的・暗黙的な因果関係を抽出し, 因果性の観点から, 糖尿病オンラインコミュニティ内で共有されている意見, 感情, 観察をよりよく理解するためのツールを提供する。
資料と方法:2017年4月から2021年1月の間に、3000万以上の英語の糖尿病関連ツイートが収集された。
ディープラーニングと自然言語処理は、個人的および感情的なコンテンツのツイートに焦点を当てるために適用された。
cause-effect-tweetデータセットが手動でラベル付けされ、トレーニングに使用される
1) 因果関係を含む因果関係文を検出するための微調整Bertweetモデル
2) BERTをベースとしたCRFモデルを用いて, 因果関係を抽出した。
原因と影響は半教師付きアプローチでクラスター化され、インタラクティブな因果効果ネットワークで可視化された。
結果: 不均衡データセットでは68%のリコールで因果文が検出された。
BERTをベースとしたCRFモデルは68%のマクロリコールで原因効果検出のための細調整BERTモデルより優れていた。
これにより96,676件の大義関連判決が下された。
ディアベテス」は中央クラスタとして同定され、「死」と「インスリン」が続く。
インスリン価格関連原因は、しばしば「死」と関連づけられた。
結論: 因果文を検出し, 明示的, 暗黙的, 単語的および多語的原因とそれに対応する効果を, BERTベースのアーキテクチャを活用し, 原因効果ネットワークとして可視化した糖尿病関連ツイートで表す新しい手法を開発した。
実生活における因果関係を抽出し,ソーシャルメディアデータから報告した患者報告の結果は,糖尿病研究において有用な補完的情報源となる。
関連論文リスト
- A Deep Learning Approach to Diabetes Diagnosis [6.4583894027770254]
3つのデータセットの実験結果は、従来の手法と比較して、全体的な精度、感度、特異性を大幅に改善したことを示している。
このことは、堅牢な糖尿病診断のためのディープラーニングモデルの可能性を示している。
論文 参考訳(メタデータ) (2024-03-12T10:18:59Z) - Discovery of the Hidden World with Large Language Models [100.38157787218044]
COAT: Causal representatiOn AssistanTについて紹介する。
COATは、非構造化データから潜在的な因果因子を抽出する因子プロジェクタとしてLLMを組み込んでいる。
LLMはデータ値の収集に使用される追加情報を提供するよう指示することもできる。
論文 参考訳(メタデータ) (2024-02-06T12:18:54Z) - Blood Glucose Level Prediction: A Graph-based Explainable Method with
Federated Learning [1.6317061277457001]
英国では、1型糖尿病の約40万人が、インスリンの不足によるインスリンの供給に依存している。
5分毎にBGを追跡するCGMは、炭水化物摂取やインスリンデリバリーなどの要因を考慮し、効果的な血糖値予測(BGLP)を可能にする。
論文 参考訳(メタデータ) (2023-12-19T19:19:35Z) - Causal ATE Mitigates Unintended Bias in Controlled Text Generation [3.228447124182563]
因果平均処理効果(Causal ATE)を用いた言語モデルの属性制御について検討する。
簡単な摂動に基づくCausal ATE法は,この意図しない効果を除去することを示す。
特に、有害性軽減の問題において、有害性軽減の課題は、しばしば除毒後に保護されたグループに現れる不注意な偏見にある。
論文 参考訳(メタデータ) (2023-11-19T05:00:39Z) - How Does Pruning Impact Long-Tailed Multi-Label Medical Image
Classifiers? [49.35105290167996]
プルーニングは、ディープニューラルネットワークを圧縮し、全体的なパフォーマンスに大きな影響を及ぼすことなく、メモリ使用量と推論時間を短縮する強力なテクニックとして登場した。
この研究は、プルーニングがモデル行動に与える影響を理解するための第一歩である。
論文 参考訳(メタデータ) (2023-08-17T20:40:30Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Zero-shot causal learning [64.9368337542558]
CaMLは因果メタラーニングフレームワークであり、各介入の効果をタスクとしてパーソナライズした予測を定式化する。
トレーニング時に存在しない新規介入のパーソナライズされた効果を予測することができることを示す。
論文 参考訳(メタデータ) (2023-01-28T20:14:11Z) - CausalDialogue: Modeling Utterance-level Causality in Conversations [83.03604651485327]
クラウドソーシングを通じて、CausalDialogueという新しいデータセットをコンパイルし、拡張しました。
このデータセットは、有向非巡回グラフ(DAG)構造内に複数の因果効果対を含む。
ニューラル会話モデルの訓練における発話レベルにおける因果性の影響を高めるために,Exponential Average Treatment Effect (ExMATE) と呼ばれる因果性強化手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T18:31:50Z) - Active Bayesian Causal Inference [72.70593653185078]
因果発見と推論を統合するための完全ベイズ能動学習フレームワークであるアクティブベイズ因果推論(ABCI)を提案する。
ABCIは因果関係のモデルと関心のクエリを共同で推論する。
我々のアプローチは、完全な因果グラフの学習のみに焦点を当てた、いくつかのベースラインよりも、よりデータ効率が高いことを示す。
論文 参考訳(メタデータ) (2022-06-04T22:38:57Z) - Using Machine Learning Techniques to Identify Key Risk Factors for
Diabetes and Undiagnosed Diabetes [0.0]
本稿では,糖尿病の有無と未診断糖尿病の有無を予測するために構築された機械学習モデルについて概説する。
次に、最高のパフォーマンスモデルの最も関連性の高い変数を比較します。
血液浸透圧、家族歴、様々な化合物の有病率、高血圧は全ての糖尿病リスクの指標である。
論文 参考訳(メタデータ) (2021-05-19T20:02:35Z) - Adherence to Personal Health Devices: A Case Study in Diabetes
Management [1.827510863075184]
本稿では,糖尿病管理における連続血糖モニターの利用について,データマイニング手法を用いて検討する。
コントロール不良の糖尿病患者は、コントロール不良の糖尿病患者よりも平均的なデータギャップ期間が長かった。
論文 参考訳(メタデータ) (2020-05-30T02:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。