論文の概要: Data-Driven Logistic Regression Ensembles With Applications in Genomics
- arxiv url: http://arxiv.org/abs/2102.08591v6
- Date: Sun, 08 Jun 2025 21:47:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 01:40:32.457025
- Title: Data-Driven Logistic Regression Ensembles With Applications in Genomics
- Title(参考訳): データ駆動ロジスティック回帰がゲノミクスの応用と融合
- Authors: Anthony-Alexander Christidis, Stefan Van Aelst, Ruben Zamar,
- Abstract要約: 本稿では,正規化とアンサンブル技術を融合した高次元バイナリ分類手法を提案する。
医学ゲノミクスの応用において,本手法は競合する手法によって見落とされた重要なバイオマーカーを同定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in data collecting technologies in genomics have significantly increased the need for tools designed to study the genetic basis of many diseases. Effective statistical methods should excel in both prediction accuracy and biomarker identification. We introduce a novel approach to high-dimensional binary classification that integrates regularization with ensembling techniques. Our method constructs compact ensembles of interpretable models derived by optimizing a global objective function. In medical genomics applications, our approach identifies critical biomarkers overlooked by competing methods. We develop a variable importance ranking system to help researchers prioritize promising genes. The method's asymptotic properties are established, and an efficient computational algorithm is provided. Through extensive simulations across complex scenarios and analysis of genomics datasets for cancer, multiple sclerosis, and psoriasis, we demonstrate strong predictive performance. Based on our numerical experiments, we offer practical guidelines for determining optimal ensemble size.
- Abstract(参考訳): ゲノム学におけるデータ収集技術の進歩は、多くの病気の遺伝的基盤を研究するために設計されたツールの必要性を著しく高めた。
効果的な統計手法は、予測精度とバイオマーカーの同定の両方において優れている。
本稿では,正規化とアンサンブル技術を融合した高次元バイナリ分類手法を提案する。
本手法は,大域的目的関数を最適化した解釈可能なモデルのコンパクトアンサンブルを構成する。
医学ゲノミクスの応用において,本手法は競合する手法によって見落とされた重要なバイオマーカーを同定する。
我々は、研究者が有望な遺伝子を優先順位付けするのに役立つ可変重要ランキングシステムを開発した。
方法の漸近特性を確立し、効率的な計算アルゴリズムを提供する。
複雑なシナリオにまたがる広範囲なシミュレーションと、がん、多発性硬化症、乾皮症に対するゲノムデータセットの分析を通じて、強い予測性能を示す。
数値実験に基づいて,最適なアンサンブルサイズを決定するための実践的ガイドラインを提案する。
関連論文リスト
- Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。
本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文 参考訳(メタデータ) (2024-09-03T09:14:21Z) - Simplicity within biological complexity [0.0]
文献を調査し、マルチスケール分子ネットワークデータの埋め込みのための包括的フレームワークの開発について論じる。
ネットワーク埋め込み手法はノードを低次元空間の点にマッピングすることにより、学習空間の近接性はネットワークのトポロジ-関数関係を反映する。
本稿では,モデルから効率的かつスケーラブルなソフトウェア実装に至るまで,マルチオミックネットワークデータのための汎用的な包括的埋め込みフレームワークを開発することを提案する。
論文 参考訳(メタデータ) (2024-05-15T13:32:45Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Embracing assay heterogeneity with neural processes for markedly
improved bioactivity predictions [0.276240219662896]
リガンドの生物活性を予測することは、コンピュータ支援薬物発見において最も困難かつ最も重要な課題の1つである。
長年のデータ収集とキュレーションの努力にもかかわらず、生物活性データは希少で不均一である。
異種アッセイ間の情報シナジーを利用した階層型メタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-17T16:26:58Z) - Functional Integrative Bayesian Analysis of High-dimensional
Multiplatform Genomic Data [0.8029049649310213]
我々は高次元多プラットフォームゲノミクスデータ(fiBAG)の関数積分ベイズ解析というフレームワークを提案する。
fiBAGは、プロテオゲノムバイオマーカーの上流での機能的証拠の同時同定を可能にする。
本研究は,14種類のがんのパン・カンサー解析を用いて,fiBAGの収益性を示す。
論文 参考訳(メタデータ) (2022-12-29T03:31:45Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。