論文の概要: Understanding Breast Cancer Survival: Using Causality and Language
Models on Multi-omics Data
- arxiv url: http://arxiv.org/abs/2305.18410v1
- Date: Sun, 28 May 2023 17:07:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 21:35:09.237436
- Title: Understanding Breast Cancer Survival: Using Causality and Language
Models on Multi-omics Data
- Title(参考訳): 乳がん生存の理解:マルチオミクスデータを用いた因果関係と言語モデルを用いて
- Authors: Mugariya Farooq, Shahad Hardan, Aigerim Zhumbhayeva, Yujia Zheng,
Preslav Nakov, Kun Zhang
- Abstract要約: 乳がんと診断された患者の生存にゲノムの摂動がどう影響するかを調べるために因果探索アルゴリズムを利用した。
本研究は, 因果発見アルゴリズムを用いた患者の生命予後に関する重要な要因を明らかにするものである。
結果は、バイオメディカル文献に基づいて訓練された言語モデルによって検証される。
- 参考スコア(独自算出の注目度): 23.850817918011863
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The need for more usable and explainable machine learning models in
healthcare increases the importance of developing and utilizing causal
discovery algorithms, which aim to discover causal relations by analyzing
observational data. Explainable approaches aid clinicians and biologists in
predicting the prognosis of diseases and suggesting proper treatments. However,
very little research has been conducted at the crossroads between causal
discovery, genomics, and breast cancer, and we aim to bridge this gap.
Moreover, evaluation of causal discovery methods on real data is in general
notoriously difficult because ground-truth causal relations are usually
unknown, and accordingly, in this paper, we also propose to address the
evaluation problem with large language models. In particular, we exploit
suitable causal discovery algorithms to investigate how various perturbations
in the genome can affect the survival of patients diagnosed with breast cancer.
We used three main causal discovery algorithms: PC, Greedy Equivalence Search
(GES), and a Generalized Precision Matrix-based one. We experiment with a
subset of The Cancer Genome Atlas, which contains information about mutations,
copy number variations, protein levels, and gene expressions for 705 breast
cancer patients. Our findings reveal important factors related to the vital
status of patients using causal discovery algorithms. However, the reliability
of these results remains a concern in the medical domain. Accordingly, as
another contribution of the work, the results are validated through language
models trained on biomedical literature, such as BlueBERT and other large
language models trained on medical corpora. Our results profess proper
utilization of causal discovery algorithms and language models for revealing
reliable causal relations for clinical applications.
- Abstract(参考訳): 医療におけるより有用で説明可能な機械学習モデルの必要性は、観察データの解析による因果関係の発見を目的とした因果発見アルゴリズムの開発と活用の重要性を高める。
説明可能なアプローチは、臨床医や生物学者が疾患の予後を予測し、適切な治療を提案するのを助ける。
しかし、因果発見、ゲノム学、乳癌の交差点での研究はほとんど行われておらず、このギャップを埋めることを目指しています。
また,実データに対する因果関係が不明なため,実データにおける因果関係の発見手法の評価は一般には困難であり,そのために,大規模言語モデルを用いた評価問題に対処することを提案する。
特に,乳がんと診断された患者の生存にゲノムの様々な摂動がどのように影響するかを調べるために,適切な因果発見アルゴリズムを利用する。
我々は, PC, Greedy Equivalence Search (GES), Generalized Precision Matrixベースの3つの因果探索アルゴリズムを用いた。
The Cancer Genome Atlasのサブセットを実験し、705例の乳癌患者に対して、突然変異、コピー数の変化、タンパク質レベル、遺伝子発現に関する情報を含む。
以上より,因果発見アルゴリズムを用いた患者の生命状態に関連する重要な因子が明らかになった。
しかし、これらの結果の信頼性は医療分野でも懸念されている。
それゆえ、この研究の別の貢献として、結果は、ブルーバートなどの生物医学文献で訓練された言語モデルと、医療コーパスで訓練された他の大きな言語モデルによって検証される。
本研究は, 臨床応用における信頼性の高い因果関係を明らかにするために, 因果発見アルゴリズムと言語モデルの適切な利用を約束する。
関連論文リスト
- Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Applying Large Language Models for Causal Structure Learning in Non
Small Cell Lung Cancer [8.248361703850774]
因果発見は、医療AI研究において重要な役割を担っている。
本稿では,大言語モデルを用いて,因果発見におけるエッジの方向性を決定する問題について検討する。
その結果,LLMは因果グラフのエッジの方向を正確に予測でき,既存の最先端手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-13T09:31:14Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Deep Reinforcement Learning Framework for Thoracic Diseases
Classification via Prior Knowledge Guidance [49.87607548975686]
関連疾患に対するラベル付きデータの不足は、正確な診断にとって大きな課題となる。
本稿では,診断エージェントの学習を指導するための事前知識を導入する,新しい深層強化学習フレームワークを提案する。
提案手法の性能はNIHX-ray 14とCheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-06-02T01:46:31Z) - Machine Learning Approach for Cancer Entities Association and
Classification [0.0]
この研究は、非自明な2つのNLP、自然言語処理機能、エンティティ認識、テキスト分類を用いて、生物医学文献から知識を発見する。
名前付きエンティティ認識(NER)は、ユーザフレンドリーなインターフェースと組み込み辞書のサポートにより、構造化されていないテキストから、がんに関連する事前定義されたエンティティを認識し、抽出する。
テキスト分類は、テキストに対する洞察を探求し、データの分類、クエリ、記事のスクリーニングを簡単にするのに役立つ。
論文 参考訳(メタデータ) (2023-05-30T07:36:12Z) - Risk Assessment of Lymph Node Metastases in Endometrial Cancer Patients:
A Causal Approach [1.8933952173153485]
本稿では,ブートストラップ再サンプリングに基づく因果ベイズネットワークの因果探索アルゴリズムを提案する。
ランダムに欠落する可能性のある欠落データの存在を踏まえて,本研究の長所と短所について考察する。
論文 参考訳(メタデータ) (2023-05-17T08:33:32Z) - Learning interpretable causal networks from very large datasets,
application to 400,000 medical records of breast cancer patients [1.2647816797166165]
我々は,汎用的な相互情報最高原理に基づく,より信頼性が高くスケーラブルな因果探索法(iMIIC)を報告する。
乳がん患者396,179名を対象に,iMIICの医療データと実生医療データについて紹介した。
論文 参考訳(メタデータ) (2023-03-11T15:18:19Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - JigSaw: A tool for discovering explanatory high-order interactions from
random forests [0.0]
JigSawは、森林の予測を説明するパターンの発見を支援するために開発された。
心臓病に関する臨床測定のパターンを特定するために最初に使用された。
その後、血液中の代謝物を用いて乳がんに関連するパターンを見つけるために使用された。
論文 参考訳(メタデータ) (2020-05-09T01:53:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。