論文の概要: A Bioinformatic Approach Validated Utilizing Machine Learning Algorithms to Identify Relevant Biomarkers and Crucial Pathways in Gallbladder Cancer
- arxiv url: http://arxiv.org/abs/2410.14433v1
- Date: Fri, 18 Oct 2024 12:51:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:09.928877
- Title: A Bioinformatic Approach Validated Utilizing Machine Learning Algorithms to Identify Relevant Biomarkers and Crucial Pathways in Gallbladder Cancer
- Title(参考訳): 胆嚢癌における関連バイオマーカーと十字路の同定のための機械学習アルゴリズムを用いたバイオインフォマティクス的アプローチ
- Authors: Rabea Khatun, Wahia Tasnim, Maksuda Akter, Md Manowarul Islam, Md. Ashraf Uddin, Md. Zulfiker Mahmud, Saurav Chandra Das,
- Abstract要約: 胆嚢癌(GBC)は胆道系腫瘍の中で最も多い疾患である。
GBCにおけるバイオマーカーの役割について最近の研究はほとんどない。
バイオマーカーの同定には機械学習(ML)とバイオインフォマティクス(バイオインフォマティクス)を用いた。
- 参考スコア(独自算出の注目度): 2.3087284629747766
- License:
- Abstract: Gallbladder cancer (GBC) is the most frequent cause of disease among biliary tract neoplasms. Identifying the molecular mechanisms and biomarkers linked to GBC progression has been a significant challenge in scientific research. Few recent studies have explored the roles of biomarkers in GBC. Our study aimed to identify biomarkers in GBC using machine learning (ML) and bioinformatics techniques. We compared GBC tumor samples with normal samples to identify differentially expressed genes (DEGs) from two microarray datasets (GSE100363, GSE139682) obtained from the NCBI GEO database. A total of 146 DEGs were found, with 39 up-regulated and 107 down-regulated genes. Functional enrichment analysis of these DEGs was performed using Gene Ontology (GO) terms and REACTOME pathways through DAVID. The protein-protein interaction network was constructed using the STRING database. To identify hub genes, we applied three ranking algorithms: Degree, MNC, and Closeness Centrality. The intersection of hub genes from these algorithms yielded 11 hub genes. Simultaneously, two feature selection methods (Pearson correlation and recursive feature elimination) were used to identify significant gene subsets. We then developed ML models using SVM and RF on the GSE100363 dataset, with validation on GSE139682, to determine the gene subset that best distinguishes GBC samples. The hub genes outperformed the other gene subsets. Finally, NTRK2, COL14A1, SCN4B, ATP1A2, SLC17A7, SLIT3, COL7A1, CLDN4, CLEC3B, ADCYAP1R1, and MFAP4 were identified as crucial genes, with SLIT3, COL7A1, and CLDN4 being strongly linked to GBC development and prediction.
- Abstract(参考訳): 胆嚢癌(GBC)は胆道系腫瘍の中で最も多い疾患である。
GBCの進行に伴う分子機構とバイオマーカーの同定は、科学研究において重要な課題である。
GBCにおけるバイオマーカーの役割について最近の研究はほとんどない。
本研究の目的は,機械学習(ML)とバイオインフォマティクス技術を用いて,GBC内のバイオマーカーを同定することであった。
NCBI GEOデータベースから得られた2つのマイクロアレイデータセット(GSE100363, GSE139682)からGBC腫瘍サンプルを正常標本と比較し, 差分発現遺伝子(DEG)を同定した。
合計146個のDGが発見され、39個の過剰発現遺伝子と107個の低発現遺伝子が検出された。
DAVIDを介する遺伝子オントロジー(GO)とREACTOME経路を用いて,これらのDigital Enrichment Analysisを行った。
STRINGデータベースを用いてタンパク質-タンパク質相互作用ネットワークを構築した。
ハブ遺伝子を同定するために、Degree、MNC、Closeness Centralityの3つのランキングアルゴリズムを適用した。
これらのアルゴリズムからハブ遺伝子の交叉は11のハブ遺伝子を得た。
同時に2つの特徴選択法(ピアソン相関法と再帰的特徴除去法)を用いて重要な遺伝子サブセットを同定した。
そして、GSE100363データセット上でSVMとRFを用いてMLモデルを構築し、GSE139682の検証を行い、GBCサンプルを最もよく識別する遺伝子サブセットを決定する。
ハブ遺伝子は他の遺伝子サブセットよりも優れていた。
最後に、NTRK2、COL14A1、SCN4B、ATP1A2、SLC17A7、SLIT3、COL7A1、CLDN4、CLEC3B、ADCYAP1R1、MFAP4が重要な遺伝子として同定され、SLIT3、COL7A1、CLDN4はGBCの発達と予測に強く関係している。
関連論文リスト
- Precision Cancer Classification and Biomarker Identification from mRNA Gene Expression via Dimensionality Reduction and Explainable AI [0.9423257767158634]
本研究では,33種類の異なる癌とその対応する遺伝子群を正確に同定するための包括的パイプラインを提案する。
正規化と特徴選択技術を組み合わせて、データセットの次元性を効果的に削減する。
我々はExplainable AIを利用して、同定された癌特異的遺伝子の生物学的意義を解明する。
論文 参考訳(メタデータ) (2024-10-08T18:56:31Z) - Prompting Whole Slide Image Based Genetic Biomarker Prediction [13.764676578911526]
本稿では,全スライド画像(WSI)に基づく遺伝的バイオマーカー予測手法を提案する。
我々は、大きな言語モデルを利用して、遺伝バイオマーカーに関連する事例を抽出する際、先行知識となる医学的プロンプトを生成する。
腫瘍微小環境におけるバイオマーカー情報のマイニングには粗大なアプローチを採用する。
論文 参考訳(メタデータ) (2024-06-26T11:05:46Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Exploring Gene Regulatory Interaction Networks and predicting
therapeutic molecules for Hypopharyngeal Cancer and EGFR-mutated lung
adenocarcinoma [5.178086150698542]
本研究では,下咽頭癌におけるEGFR変異肺腺癌と下咽頭癌について検討した。
本研究は,10のハブ遺伝子に基づく選択疾患に対する共通治療分子を示唆するものである。
論文 参考訳(メタデータ) (2024-02-27T11:29:36Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures [0.0]
がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
論文 参考訳(メタデータ) (2023-05-01T07:16:40Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Biomarker Gene Identification for Breast Cancer Classification [2.403531305046943]
本研究は,バイオマーカーの同定にサブタイプ分類に用いるディープニューラルネットワークによる解釈予測を用いた。
提案したアルゴリズムは、43個の差分表現された遺伝子シグネチャの発見に繋がった。
論文 参考訳(メタデータ) (2021-11-10T06:38:50Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。