論文の概要: A Fast and Practical Column Generation Approach for Identifying Carcinogenic Multi-Hit Gene Combinations
- arxiv url: http://arxiv.org/abs/2602.22551v1
- Date: Thu, 26 Feb 2026 02:45:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.493213
- Title: A Fast and Practical Column Generation Approach for Identifying Carcinogenic Multi-Hit Gene Combinations
- Title(参考訳): 発癌性多型遺伝子の組み合わせを同定するための高速かつ実用的なカラム生成手法
- Authors: Rick S. H. Willemsen, Tenindra Abeywickrama, Ramu Anandakrishnan,
- Abstract要約: がんは、しばしば、推定2から9の遺伝子変異の特定の組み合わせによって引き起こされる。
この課題をMHCD SCP(Multi-Hit Cancer Driver Set Cover Problem)として定式化した。これは、正常サンプルのカバレッジを最小化しつつ、腫瘍サンプルのカバレッジを最大化する遺伝子の組み合わせを選択するバイナリ分類問題である。
- 参考スコア(独自算出の注目度): 0.40831821256838124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cancer is often driven by specific combinations of an estimated two to nine gene mutations, known as multi-hit combinations. Identifying these combinations is critical for understanding carcinogenesis and designing targeted therapies. We formalise this challenge as the Multi-Hit Cancer Driver Set Cover Problem (MHCDSCP), a binary classification problem that selects gene combinations to maximise coverage of tumor samples while minimising coverage of normal samples. Existing approaches typically rely on exhaustive search and supercomputing infrastructure. In this paper, we present constraint programming and mixed integer programming formulations of the MHCDSCP. Evaluated on real-world cancer genomics data, our methods achieve performance comparable to state-of-the-art methods while running on a single commodity CPU in under a minute. Furthermore, we introduce a column generation heuristic capable of solving small instances to optimality. These results suggest that solving the MHCDSCP is less computationally intensive than previously believed, thereby opening research directions for exploring modelling assumptions.
- Abstract(参考訳): がんは、しばしば、推定2から9の遺伝子変異の特定の組み合わせによって引き起こされる。
これらの組み合わせを同定することは、発がんの理解と標的治療の設計に不可欠である。
この課題をMHCDSCP (Multi-Hit Cancer Driver Set Cover Problem) として定式化した。これは、正常サンプルのカバレッジを最小化しつつ、腫瘍サンプルのカバレッジを最大化するために遺伝子の組み合わせを選択する二項分類問題である。
既存のアプローチは通常、徹底的な検索とスーパーコンピューティングのインフラに依存している。
本稿では,MHCDSCPの制約プログラミングと混合整数プログラミングの定式化について述べる。
実世界のがんゲノムデータから評価し,1つのコモディティCPU上で1分以内で動作しながら,最先端の手法に匹敵する性能を実現する。
さらに,小インスタンスを最適に解決できる列生成ヒューリスティックを導入する。
これらの結果から,MHCDSCPの解法は従来考えられていたよりも計算集約性が低いことが示唆された。
関連論文リスト
- Kernel-Based Learning of Chest X-ray Images for Predicting ICU Escalation among COVID-19 Patients [5.030572036126222]
多重カーネル学習(MKL)は、より単純なカーネルから複合カーネルを構築し、異種ソースからの情報を統合することで、これらの制限に対処する。
我々はMKLを拡張して指数族に属する結果変数を対応させ、より広範なデータ型を表現し、提案手法をカーネルと統合された多重加算回帰を持つ一般化線形モデル(GLIMARK)として参照する。
我々は, GLIMARKを新型コロナウイルス胸部X線データセットに適用し, ICUエスカレーションのバイナリ結果を予測し, 臨床的に有意な特徴を抽出した。
論文 参考訳(メタデータ) (2026-02-10T20:11:43Z) - A Hybrid Mixture Approach for Clustering and Characterizing Cancer Data [0.07673339435080444]
最新のバイオメディカルデータは、従来のクラスタ分析においてモデル推定を行うのが困難である。
本稿では,クラスタとモデルパラメータを効率的に推定するハイブリッド行列フリー計算手法を提案する。
本アルゴリズムは, 乳がんの悪性度を, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度, 悪性度,
論文 参考訳(メタデータ) (2025-07-18T22:01:03Z) - Exhaustive Exploitation of Nature-inspired Computation for Cancer Screening in an Ensemble Manner [20.07173196364489]
本研究では、遺伝子発現データからがん分類のためのアンサンブル学習を改善するために、進化最適化逆アンサンブル学習(EODE)と呼ばれるフレームワークを提案する。
各種癌種を含む35の遺伝子発現ベンチマークデータセットを対象に実験を行った。
論文 参考訳(メタデータ) (2024-04-06T08:07:48Z) - A Fast Algorithm for the Real-Valued Combinatorial Pure Exploration of Multi-Armed Bandit [55.2480439325792]
多武装バンディット(R-CPE-MAB)の真価純探査問題について検討する。
本稿では,差分に基づく探索法 (CombGapE) アルゴリズムを提案する。
我々は,CombGapEアルゴリズムが,合成データセットと実世界のデータセットの両方において,既存の手法を大幅に上回っていることを数値的に示す。
論文 参考訳(メタデータ) (2023-06-15T15:37:31Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Stacked Autoencoder Based Multi-Omics Data Integration for Cancer
Survival Prediction [3.083561980077652]
重畳オートエンコーダを用いた生存予測ニューラルネットワーク(SAEsurv-net)と呼ばれる,がん生存予測のためのマルチオミクスデータの統合手法を提案する。
SAEsurv-netは、2段階の次元減少戦略で次元の呪いに対処し、重ねられた計算オートエンコーダモデルで多次元の不均一性を扱う。
実験の結果、SAEsurv-netは単一のタイプのデータと他の最先端の手法に基づくモデルよりも優れていた。
論文 参考訳(メタデータ) (2022-07-08T13:53:11Z) - Faster One-Sample Stochastic Conditional Gradient Method for Composite
Convex Minimization [61.26619639722804]
滑らかで非滑らかな項の和として形成される凸有限サム目標を最小化するための条件勾配法(CGM)を提案する。
提案手法は, 平均勾配 (SAG) 推定器を備え, 1回に1回のサンプルしか必要としないが, より高度な分散低減技術と同等の高速収束速度を保証できる。
論文 参考訳(メタデータ) (2022-02-26T19:10:48Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。