論文の概要: Multi-Modal Machine Learning for Population- and Subject-Specific lncRNA-Type 2 Diabetes Association Analysis
- arxiv url: http://arxiv.org/abs/2605.20747v2
- Date: Sat, 23 May 2026 19:24:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:32:37.852988
- Title: Multi-Modal Machine Learning for Population- and Subject-Specific lncRNA-Type 2 Diabetes Association Analysis
- Title(参考訳): 人口別および主観的lncRNA型2型糖尿病関連解析のためのマルチモーダル機械学習
- Authors: Ashwani Siwach, Sanjeev Narayan Sharma, Sunil Datt Sharma,
- Abstract要約: 2型糖尿病(T2D)を含む慢性疾患の病因に関与する長鎖非コードRNA(lncRNA)の出現
本研究は,T2Dに付随する2つの独立したRNA-seqコホートで報告された10個のlncRNAについて検討した。
組込み多機能フレームワークを開発し,lncRNAの発現,二次構造,配列の特徴を抽出した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Long non-coding RNAs (lncRNAs) are emerging regulatory molecules implicated in chronic disease pathogenesis, including Type 2 Diabetes Mellitus (T2D). We investigated ten literature reported lncRNAs associated with T2D: MALAT1, MEG3, MIAT, ANRIL, GAS5, KCNQ1OT1, H19, BCYRN1, XIST, and HOTAIR across two independent population-based RNA-seq cohorts. Single-omics approaches provide an incomplete view of disease biology, therefore, an integrative multi-feature framework was developed, extracting expression, secondary-structure, and sequence features for each lncRNA. Eight machine learning (ML) classifiers were evaluated under stratified k-fold, leave-one-out cross-validation (LOOCV), and repeated hold-out schemes to ensure robust performance estimation. SHAP analysis was applied for subject-level association interpretation. In one cohort, GAS5 and XIST expression features, along with GAS5, MEG3, and ANRIL sequence features, were found to be associated with T2D, while MALAT1 expression and KCNQ1OT1, ANRIL, and MEG3 sequence features were found to be associated in the second cohort. MEG3 was identified by SHAP as the dominant lncRNA in both cohorts. ML results were consistent with established statistical methods while additionally providing population- and subject-level disease association profiles linked to specific molecular feature types. The proposed framework advances mechanistic understanding of T2D and supports lncRNA-based precision medicine.
- Abstract(参考訳): 長鎖非コードRNA (lncRNA) は慢性疾患の病態に関係し、T2D型糖尿病 (Type 2 Diabetes Mellitus) などである。
MALAT1, MEG3, MIAT, ANRIL, GAS5, KCNQ1OT1, H19, BCYRN1, XIST, HOTAIRのT2D関連文献を2つの独立したRNA配列コホートで調査した。
単一オミクスアプローチは、疾患生物学の不完全ビューを提供するため、各lncRNAに対する発現、二次構造、配列の特徴を抽出する統合多機能フレームワークが開発された。
8つの機械学習 (ML) 分類器を, k-fold, leave-one-out cross-validation (LOOCV) で評価した。
SHAP分析を主観的関連解釈に適用した。
1つのコホートにおいて、GAS5, MEG3, ANRIL配列の特徴とともにGAS5, XIST発現の特徴はT2Dに関連し、MALAT1発現とKCNQ1OT1, ANRILおよびMEG3配列の特徴は第2コホートに関連していることがわかった。
MEG3はSHAPによって両コホートにおけるlncRNAの支配的存在として同定された。
MLの結果は確立された統計的手法と一致し, 特定の分子の特徴型に関連する集団レベルおよび主観レベルの疾患関連プロファイルを付加した。
提案するフレームワークはT2Dの機械的理解を促進し、lncRNAベースの精密医療をサポートする。
関連論文リスト
- RNA-FM: Flow-Matching Generative Model for Genome-wide RNA-Seq Prediction [48.07329582311906]
本研究では,全スライディング画像からのゲノムワイドRNA配列予測のためのフローマッチング生成フレームワークであるRNA-FMを提案する。
RNA-FMは、連続時間条件付き輸送問題として転写予測を定式化する。
スケーラブルで生物学的に解釈可能なゲノムワイド遺伝子発現抑制を可能にする。
論文 参考訳(メタデータ) (2026-05-12T06:48:58Z) - R-GenIMA: Integrating Neuroimaging and Genetics with Interpretable Multimodal AI for Alzheimer's Disease Progression [63.97617759805451]
アルツハイマー病の早期発見には、マクロスケールの神経解剖学的変化とマイクロスケールの遺伝的感受性を統合できるモデルが必要である。
本稿では,新しいROIワイド・ビジョン・トランスフォーマと遺伝的プロンプトを結合した多モード多言語モデルR-GenIMAを紹介する。
R-GenIMAは、通常の認知、主観記憶、軽度認知障害、ADの4方向分類において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-12-22T02:54:10Z) - A HyperGraphMamba-Based Multichannel Adaptive Model for ncRNA Classification [7.598192367116628]
非コードRNA(ncRNA)は、遺伝子発現調節と様々な疾患の病原性において重要な役割を担っている。
本稿では,HGMamba-ncRNAを提案する。HGMamba-ncRNAはHyperGraphMambaをベースとしたマルチチャネル適応モデルである。
3つの公開データセットで実施された実験は、HGMamba-ncRNAが精度やその他の指標で常に最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2025-09-24T15:31:49Z) - AI-Driven Drug Repurposing through miRNA-mRNA Relation [0.2797211052758563]
mRNA関係はいくつかの生物学的プロセスと疾患機構と密接に関連している。
今回われわれは,慢性閉塞性肺疾患に対するPubMedからmRNA関係を抽出するためにPubMedBERTモデルを適用した。
論文 参考訳(メタデータ) (2025-09-03T14:12:32Z) - Equi-mRNA: Protein Translation Equivariant Encoding for mRNA Language Models [0.0]
2次元特殊直交行列(SO(2))の巡回部分群として同義コドン対称性を明示的に符号化する最初のコドンレベル同変mRNAモデルであるEqui-mRNAを導入する。
発現、安定性、リボスイッチングを含む下流特性予測タスクでは、Equi-mRNAは精度を最大10%向上させる。
Equi-mRNAはmRNAモデリングのための新しい生物学的原理のパラダイムを確立し、次世代治療の設計に重要な意味を持つ。
論文 参考訳(メタデータ) (2025-08-20T22:42:10Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Bridging Sequence-Structure Alignment in RNA Foundation Models [7.068604225076706]
基礎モデル(FM)におけるRNA配列と構造との整合性についてはまだ研究されていない。
既存のFMは配列構造アライメントを確立するのに苦労しており、ゲノム情報の自由な流れを妨げる。
OmniGenomeはRNA配列を構造コンテクスト化されたモデリングに基づく二次構造に整合させる訓練されたRNA FMである。
論文 参考訳(メタデータ) (2024-07-15T21:10:40Z) - Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.193512039121984]
RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - Confidence-guided Lesion Mask-based Simultaneous Synthesis of Anatomic
and Molecular MR Images in Patients with Post-treatment Malignant Gliomas [65.64363834322333]
信頼性ガイドSAMR(CG-SAMR)は、病変情報からマルチモーダル解剖学的配列にデータを合成する。
モジュールは中間結果に対する信頼度測定に基づいて合成をガイドする。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-06T20:20:22Z) - Deep Belief Network based representation learning for lncRNA-disease
association prediction [0.0]
lncRNA-解離関連を正確に同定することは、lncRNAの機能と疾患機構を理解するのに不可欠である。
近年,生物学的ネットワーク解析において,ネットワーク特徴の潜在表現を学習するために,ディープ信頼ネットワーク (DBN) が用いられている。
本稿では,DBNをベースとしたlncRNA-解離関連予測モデル(DBNLDA)を提案する。
論文 参考訳(メタデータ) (2020-06-22T18:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。