論文の概要: InfoSEM: A Deep Generative Model with Informative Priors for Gene Regulatory Network Inference
- arxiv url: http://arxiv.org/abs/2503.04483v1
- Date: Thu, 06 Mar 2025 14:32:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 16:00:49.719271
- Title: InfoSEM: A Deep Generative Model with Informative Priors for Gene Regulatory Network Inference
- Title(参考訳): InfoSEM:遺伝子制御ネットワーク推論のためのインフォーマルプリミティブを持つ深層生成モデル
- Authors: Tianyu Cui, Song-Jun Xu, Artem Moskalev, Shuwei Li, Tommaso Mansi, Mangal Prakash, Rui Liao,
- Abstract要約: 遺伝子発現データから遺伝子制御ネットワーク(GRN)を推定することは生物学的プロセスを理解する上で重要である。
インフォメーションモデルであるInfoSEMを導入する。
バイオマーカー発見などの現実世界の応用をよりよく反映した,生物学的に動機づけたベンチマークフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.17096244556794
- License:
- Abstract: Inferring Gene Regulatory Networks (GRNs) from gene expression data is crucial for understanding biological processes. While supervised models are reported to achieve high performance for this task, they rely on costly ground truth (GT) labels and risk learning gene-specific biases, such as class imbalances of GT interactions, rather than true regulatory mechanisms. To address these issues, we introduce InfoSEM, an unsupervised generative model that leverages textual gene embeddings as informative priors, improving GRN inference without GT labels. InfoSEM can also integrate GT labels as an additional prior when available, avoiding biases and further enhancing performance. Additionally, we propose a biologically motivated benchmarking framework that better reflects real-world applications such as biomarker discovery and reveals learned biases of existing supervised methods. InfoSEM outperforms existing models by 38.5% across four datasets using textual embeddings prior and further boosts performance by 11.1% when integrating labeled data as priors.
- Abstract(参考訳): 遺伝子発現データから遺伝子制御ネットワーク(GRN)を推定することは生物学的プロセスを理解する上で重要である。
教師付きモデルは高い性能を達成するために報告されているが、それらは真の規制機構ではなく、GT相互作用のクラス不均衡のようなリスク学習遺伝子固有のバイアスとコストライグラウンド・真実(GT)ラベルに依存している。
これらの問題に対処するため,本研究では,GTラベルを使わずにGRN推論を改善するために,テキスト遺伝子埋め込みを情報先行として活用する教師なし生成モデルであるInfoSEMを紹介する。
InfoSEMはまた、GTラベルを利用可能な追加の事前として統合することができ、バイアスを回避し、パフォーマンスをさらに向上することができる。
さらに,バイオマーカー発見などの実世界の応用をよりよく反映し,既存の教師付き手法の学習バイアスを明らかにする,生物学的動機付け型ベンチマークフレームワークを提案する。
InfoSEMは4つのデータセットで既存のモデルを38.5%上回り、ラベル付きデータを事前に組み込むと、さらに11.1%パフォーマンスが向上する。
関連論文リスト
- GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [84.41557981816077]
本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-03T07:04:29Z) - Gene Regulatory Network Inference in the Presence of Selection Bias and Latent Confounders [14.626706466908386]
Gene Regulatory Network Inference (GRNI) は遺伝子発現データを用いて遺伝子間の因果関係を同定することを目的としている。
遺伝子発現は非コーディングRNAのような潜伏した共同設立者の影響を受けており、GRNIに複雑さを増す。
本稿では,選択バイアスと潜在的共同設立者の存在下でのGISL(Gene Regulatory Network Inference in the presence of Selection bias and Latent Confounders)を提案する。
論文 参考訳(メタデータ) (2025-01-17T11:27:58Z) - Knowledge-Guided Biomarker Identification for Label-Free Single-Cell RNA-Seq Data: A Reinforcement Learning Perspective [24.247247851943982]
本稿では、既存の遺伝子選択アルゴリズムからのアンサンブル知識を利用して、予備的境界や事前知識を確立する反復的な遺伝子パネル選択戦略を提案する。
我々は、専門家の行動によって形成される報酬関数を通じて強化学習を取り入れ、動的洗練と遺伝子パネルの標的選択を可能にした。
本研究は, 単細胞ゲノムデータ解析における本手法の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2025-01-02T07:57:41Z) - UniGen: A Unified Framework for Textual Dataset Generation Using Large Language Models [88.16197692794707]
UniGenは、多様で正確で高度に制御可能なデータセットを作成するように設計された包括的なフレームワークである。
データ多様性を強化するため、UniGenは属性誘導生成モジュールとグループチェック機能を備えている。
大規模な実験は、UniGenによって生成されたデータの優れた品質を示す。
論文 参考訳(メタデータ) (2024-06-27T07:56:44Z) - Horizon-wise Learning Paradigm Promotes Gene Splicing Identification [6.225959701339916]
本稿では,Horizon-wise Gene Splicing Identification (H-GSI) という遺伝子スプライシング識別作業のための新しいフレームワークを提案する。
提案するH-GSIは,文字列データをテンソルに変換する前処理手順,長いシーケンスを扱うスライディングウインドウ手法,SeqLabモデル,予測器の4つのコンポーネントから構成される。
切断された固定長配列で遺伝子情報を処理している既存の研究とは対照的に、H-GSIは1つの前方計算でシーケンス内の全ての位置を予測する水平方向同定パラダイムを採用している。
論文 参考訳(メタデータ) (2024-06-15T08:18:09Z) - Bt-GAN: Generating Fair Synthetic Healthdata via Bias-transforming Generative Adversarial Networks [3.3903891679981593]
本稿では,医療領域に特化して設計されたGANベースの合成データジェネレータであるBias-transforming Generative Adversarial Networks (Bt-GAN)について述べる。
以上の結果から,Bt-GANはSOTA精度を向上し,公平性とバイアスの最小化を図った。
論文 参考訳(メタデータ) (2024-04-21T12:16:38Z) - Exploring Sparsity in Graph Transformers [67.48149404841925]
グラフ変換器(GT)は、様々なグラフ関連タスクにおいて印象的な結果を得た。
しかし、GTsの膨大な計算コストは、特に資源制約のある環境でのデプロイメントと応用を妨げる。
我々は、GTの計算複雑性を低減するのに役立つ、包括的な textbfGraph textbfTransformer textbfSParsification (GTSP) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-09T06:21:44Z) - Biomedical knowledge graph-optimized prompt generation for large language models [1.6658478064349376]
大規模言語モデル(LLM)は前例のない速度で採用されているが、バイオメディシンのような知識集約ドメインでは依然として課題に直面している。
本稿では,トークン最適化およびロバストな知識グラフに基づくRetrieval Augmented Generationフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-11-29T03:07:00Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。