論文の概要: Identifying causal associations in tweets using deep learning: Use case
on diabetes-related tweets from 2017-2021
- arxiv url: http://arxiv.org/abs/2111.01225v1
- Date: Mon, 1 Nov 2021 19:25:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 12:44:19.735629
- Title: Identifying causal associations in tweets using deep learning: Use case
on diabetes-related tweets from 2017-2021
- Title(参考訳): ディープラーニングを用いたツイートの因果関係の同定--2017-2021年の糖尿病関連ツイートを事例として
- Authors: Adrian Ahne (1 and 2), Vivek Khetan (3), Xavier Tannier (4), Md
Imbessat Hassan Rizvi (5), Thomas Czernichow (2), Francisco Orchard (2),
Charline Bour (6), Andrew Fano (3), Guy Fagherazzi (6) ((1) Paris-Saclay
University, UVSQ, Inserm, Gustave Roussy, Exposome and Heredity team, CESP,
F-94805, Villejuif, France, (2) Epiconcept, Paris, France, (3) Accenture
Labs, San Francisco, USA, (4) Sorbonne University, Inserm, University
Sorbonne Paris Nord, Laboratoire d'Informatique Medicale et d'Ingenierie des
Connaissances pour la e-Sante, LIMICS, Paris, France, (5) Indian Institute of
Science, Bengaluru, India, (6) Deep Digital Phenotyping Research Unit,
Department of Precision Health, Luxembourg Institute of Health, Strassen,
Luxembourg)
- Abstract要約: 本研究の目的は,糖尿病関連ツイートの明示的および暗黙的な因果関係を抽出することである。
2017年4月から2021年1月にかけて、英語で3000万以上の糖尿病関連ツイートが収集された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Objective: Leveraging machine learning methods, we aim to extract both
explicit and implicit cause-effect associations in patient-reported,
diabetes-related tweets and provide a tool to better understand opinion,
feelings and observations shared within the diabetes online community from a
causality perspective. Materials and Methods: More than 30 million
diabetes-related tweets in English were collected between April 2017 and
January 2021. Deep learning and natural language processing methods were
applied to focus on tweets with personal and emotional content. A
cause-effect-tweet dataset was manually labeled and used to train 1) a
fine-tuned Bertweet model to detect causal sentences containing a causal
association 2) a CRF model with BERT based features to extract possible
cause-effect associations. Causes and effects were clustered in a
semi-supervised approach and visualised in an interactive cause-effect-network.
Results: Causal sentences were detected with a recall of 68% in an imbalanced
dataset. A CRF model with BERT based features outperformed a fine-tuned BERT
model for cause-effect detection with a macro recall of 68%. This led to 96,676
sentences with cause-effect associations. "Diabetes" was identified as the
central cluster followed by "Death" and "Insulin". Insulin pricing related
causes were frequently associated with "Death". Conclusions: A novel
methodology was developed to detect causal sentences and identify both explicit
and implicit, single and multi-word cause and corresponding effect as expressed
in diabetes-related tweets leveraging BERT-based architectures and visualised
as cause-effect-network. Extracting causal associations on real-life, patient
reported outcomes in social media data provides a useful complementary source
of information in diabetes research.
- Abstract(参考訳): 目的: 糖尿病関連ツイートにおける明示的・暗黙的な因果関係を抽出し, 因果性の観点から, 糖尿病オンラインコミュニティ内で共有されている意見, 感情, 観察をよりよく理解するためのツールを提供する。
資料と方法:2017年4月から2021年1月の間に、3000万以上の英語の糖尿病関連ツイートが収集された。
ディープラーニングと自然言語処理は、個人的および感情的なコンテンツのツイートに焦点を当てるために適用された。
cause-effect-tweetデータセットが手動でラベル付けされ、トレーニングに使用される
1) 因果関係を含む因果関係文を検出するための微調整Bertweetモデル
2) BERTをベースとしたCRFモデルを用いて, 因果関係を抽出した。
原因と影響は半教師付きアプローチでクラスター化され、インタラクティブな因果効果ネットワークで可視化された。
結果: 不均衡データセットでは68%のリコールで因果文が検出された。
BERTをベースとしたCRFモデルは68%のマクロリコールで原因効果検出のための細調整BERTモデルより優れていた。
これにより96,676件の大義関連判決が下された。
ディアベテス」は中央クラスタとして同定され、「死」と「インスリン」が続く。
インスリン価格関連原因は、しばしば「死」と関連づけられた。
結論: 因果文を検出し, 明示的, 暗黙的, 単語的および多語的原因とそれに対応する効果を, BERTベースのアーキテクチャを活用し, 原因効果ネットワークとして可視化した糖尿病関連ツイートで表す新しい手法を開発した。
実生活における因果関係を抽出し,ソーシャルメディアデータから報告した患者報告の結果は,糖尿病研究において有用な補完的情報源となる。
関連論文リスト
- Epidemiology-informed Network for Robust Rumor Detection [59.89351792706995]
本稿では, 疫学知識を統合し, 性能を高めるための新しい疫学情報ネットワーク(EIN)を提案する。
疫学理論をうわさ検出に適応させるため,各利用者が情報源情報に対する姿勢を付加することが期待されている。
実験結果から,提案したEINは実世界のデータセット上で最先端の手法より優れるだけでなく,樹木の深度にまたがる堅牢性も向上することが示された。
論文 参考訳(メタデータ) (2024-11-20T00:43:32Z) - Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - Exploring Biomarker Relationships in Both Type 1 and Type 2 Diabetes Mellitus Through a Bayesian Network Analysis Approach [1.004996690798013]
本研究では,上海1型と2型糖尿病データセットの分析にベイズネットワーク構造学習を適用した。
構築されたベイズネットワークは、特に2型糖尿病において、ルート平均2乗誤差(RMSE)が18.23mg/dLである顕著な予測精度を示した。
論文 参考訳(メタデータ) (2024-06-24T19:27:34Z) - DiabetesNet: A Deep Learning Approach to Diabetes Diagnosis [6.095029229301643]
3つのデータセットの実験結果は、従来の手法と比較して、全体的な精度、感度、特異性を大幅に改善したことを示している。
このことは、堅牢な糖尿病診断のためのディープラーニングモデルの可能性を示している。
論文 参考訳(メタデータ) (2024-03-12T10:18:59Z) - Blood Glucose Level Prediction: A Graph-based Explainable Method with
Federated Learning [1.6317061277457001]
英国では、1型糖尿病の約40万人が、インスリンの不足によるインスリンの供給に依存している。
5分毎にBGを追跡するCGMは、炭水化物摂取やインスリンデリバリーなどの要因を考慮し、効果的な血糖値予測(BGLP)を可能にする。
論文 参考訳(メタデータ) (2023-12-19T19:19:35Z) - How Does Pruning Impact Long-Tailed Multi-Label Medical Image
Classifiers? [49.35105290167996]
プルーニングは、ディープニューラルネットワークを圧縮し、全体的なパフォーマンスに大きな影響を及ぼすことなく、メモリ使用量と推論時間を短縮する強力なテクニックとして登場した。
この研究は、プルーニングがモデル行動に与える影響を理解するための第一歩である。
論文 参考訳(メタデータ) (2023-08-17T20:40:30Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - CausalDialogue: Modeling Utterance-level Causality in Conversations [83.03604651485327]
クラウドソーシングを通じて、CausalDialogueという新しいデータセットをコンパイルし、拡張しました。
このデータセットは、有向非巡回グラフ(DAG)構造内に複数の因果効果対を含む。
ニューラル会話モデルの訓練における発話レベルにおける因果性の影響を高めるために,Exponential Average Treatment Effect (ExMATE) と呼ばれる因果性強化手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T18:31:50Z) - Active Bayesian Causal Inference [72.70593653185078]
因果発見と推論を統合するための完全ベイズ能動学習フレームワークであるアクティブベイズ因果推論(ABCI)を提案する。
ABCIは因果関係のモデルと関心のクエリを共同で推論する。
我々のアプローチは、完全な因果グラフの学習のみに焦点を当てた、いくつかのベースラインよりも、よりデータ効率が高いことを示す。
論文 参考訳(メタデータ) (2022-06-04T22:38:57Z) - Using Machine Learning Techniques to Identify Key Risk Factors for
Diabetes and Undiagnosed Diabetes [0.0]
本稿では,糖尿病の有無と未診断糖尿病の有無を予測するために構築された機械学習モデルについて概説する。
次に、最高のパフォーマンスモデルの最も関連性の高い変数を比較します。
血液浸透圧、家族歴、様々な化合物の有病率、高血圧は全ての糖尿病リスクの指標である。
論文 参考訳(メタデータ) (2021-05-19T20:02:35Z) - Adherence to Personal Health Devices: A Case Study in Diabetes
Management [1.827510863075184]
本稿では,糖尿病管理における連続血糖モニターの利用について,データマイニング手法を用いて検討する。
コントロール不良の糖尿病患者は、コントロール不良の糖尿病患者よりも平均的なデータギャップ期間が長かった。
論文 参考訳(メタデータ) (2020-05-30T02:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。