論文の概要: Improving Diseases Predictions Utilizing External Bio-Banks
- arxiv url: http://arxiv.org/abs/2504.00036v1
- Date: Sun, 30 Mar 2025 13:05:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 15:43:08.421726
- Title: Improving Diseases Predictions Utilizing External Bio-Banks
- Title(参考訳): 外部バイオバンクを活用した疾患予測の改善
- Authors: Hido Pinto, Eran Segal,
- Abstract要約: 機械学習がどのように活用され、説明可能性を高め、生物学的に意味のある関連を明らかにするかを実証する。
LightGBMモデルをデータセット(10K)のスクラッチからトレーニングして、メタボロミクス機能をインプットします。
汚染された代謝学の特徴は、疾患に関連する危険因子に対する影響を評価するために生存分析に使用される。
- 参考スコア(独自算出の注目度): 1.9336815376402723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning has been successfully used in critical domains, such as medicine. However, extracting meaningful insights from biomedical data is often constrained by the lack of their available disease labels. In this research, we demonstrate how machine learning can be leveraged to enhance explainability and uncover biologically meaningful associations, even when predictive improvements in disease modeling are limited. We train LightGBM models from scratch on our dataset (10K) to impute metabolomics features and apply them to the UK Biobank (UKBB) for downstream analysis. The imputed metabolomics features are then used in survival analysis to assess their impact on disease-related risk factors. As a result, our approach successfully identified biologically relevant connections that were not previously known to the predictive models. Additionally, we applied a genome-wide association study (GWAS) on key metabolomics features, revealing a link between vascular dementia and smoking. Although being a well-established epidemiological relationship, this link was not embedded in the model's training data, which validated the method's ability to extract meaningful signals. Furthermore, by integrating survival models as inputs in the 10K data, we uncovered associations between metabolic substances and obesity, demonstrating the ability to infer disease risk for future patients without requiring direct outcome labels. These findings highlight the potential of leveraging external bio-banks to extract valuable biomedical insights, even in data-limited scenarios. Our results demonstrate that machine learning models trained on smaller datasets can still be used to uncover real biological associations when carefully integrated with survival analysis and genetic studies.
- Abstract(参考訳): 機械学習は医学などの重要な領域でうまく使われている。
しかしながら、バイオメディカルデータから有意義な洞察を抽出することは、しばしば、利用可能な疾患ラベルの欠如によって制限される。
本研究では, 疾患モデリングにおける予測的改善が限定されている場合でも, 機械学習をどのように活用して説明可能性を高め, 生物学的に意味のある関連を明らかにするかを示す。
私たちは、データセット(10K)のスクラッチからLightGBMモデルをトレーニングし、メタボロミクス機能をインプットし、それをUK Biobank(UKBB)に応用して、下流分析を行います。
汚染された代謝学の特徴は、疾患に関連する危険因子に対する影響を評価するために生存分析に使用される。
その結果,従来の予測モデルでは知られていなかった生物学的関係を同定することができた。
さらに,キーメタボロミクスの特徴にゲノムワイド・アソシエーション(GWAS)を応用し,血管性認知症と喫煙との関連を明らかにした。
確立された疫学的関係であるにもかかわらず、このリンクはモデルのトレーニングデータには埋め込まれておらず、意味のあるシグナルを抽出する手法の能力を検証した。
さらに,10Kデータの入力として生存モデルを統合することにより,代謝物質と肥満との関連が明らかとなり,直接結果ラベルを必要とせず,将来の疾患リスクを推測できる可能性が示された。
これらの知見は、データ限定シナリオにおいても、外部バイオバンクを活用して貴重なバイオメディカルインサイトを抽出する可能性を浮き彫りにした。
以上の結果から、より小さなデータセットでトレーニングされた機械学習モデルは、生存分析や遺伝的研究と慎重に統合された場合、実際の生物学的関連を明らかにするために依然として使用できることが示された。
関連論文リスト
- Identifying Critical Phases for Disease Onset with Sparse Haematological Biomarkers [0.0]
臨床血液検査は、大規模生物医学研究のための新しい分子データ源である。
従来の計算法は、生物学的解釈性に欠けながら歪んだ学習信号とバイアス予測にアプローチする。
デルタバイオマーカートラジェクトリをモデル化するために,GNAN(Graph Neural Additive Networks)を用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2025-03-18T07:29:45Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Embracing assay heterogeneity with neural processes for markedly
improved bioactivity predictions [0.276240219662896]
リガンドの生物活性を予測することは、コンピュータ支援薬物発見において最も困難かつ最も重要な課題の1つである。
長年のデータ収集とキュレーションの努力にもかかわらず、生物活性データは希少で不均一である。
異種アッセイ間の情報シナジーを利用した階層型メタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-17T16:26:58Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Functional Integrative Bayesian Analysis of High-dimensional
Multiplatform Genomic Data [0.8029049649310213]
我々は高次元多プラットフォームゲノミクスデータ(fiBAG)の関数積分ベイズ解析というフレームワークを提案する。
fiBAGは、プロテオゲノムバイオマーカーの上流での機能的証拠の同時同定を可能にする。
本研究は,14種類のがんのパン・カンサー解析を用いて,fiBAGの収益性を示す。
論文 参考訳(メタデータ) (2022-12-29T03:31:45Z) - Modelling Technical and Biological Effects in scRNA-seq data with
Scalable GPLVMs [6.708052194104378]
我々は,ガウス過程潜在変数モデルである確率的非線形次元減少に対する一般的なアプローチを拡張し,大規模単一セルデータセットに拡張する。
鍵となる考え方は、高速な変動推論を可能にする下位境界の分解可能性を保存する拡張カーネルを使用することである。
論文 参考訳(メタデータ) (2022-09-14T15:25:15Z) - Temporal Positive-unlabeled Learning for Biomedical Hypothesis
Generation via Risk Estimation [46.852387038668695]
本稿では,仮説生成の科学的プロセスに機械学習を導入することを目的とする。
本稿では,ノード対埋め込みの学習において,前向きの確率を推定するための変分推論モデルを提案する。
実世界のバイオメディカルな用語関係データセットの実験結果と、COVID-19データセットのケーススタディ分析により、提案モデルの有効性が検証された。
論文 参考訳(メタデータ) (2020-10-05T10:58:03Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。