論文の概要: A Bayesian Boolean Matrix Factorization with Application to Copy Number Analysis in Cancer
- arxiv url: http://arxiv.org/abs/2606.17491v2
- Date: Wed, 17 Jun 2026 02:23:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 13:57:35.218422
- Title: A Bayesian Boolean Matrix Factorization with Application to Copy Number Analysis in Cancer
- Title(参考訳): ベイズ的ブール行列分解法とコピー数解析への応用
- Authors: Adolphus Wagala, Mehmet Samur, Giovanni Parmigiani,
- Abstract要約: がんゲノム学では、BooMFは、腫瘍の進化を促進する可能性のある、協調した特徴変化を明らかにすることができる。
BBMFは完全に共役な生成モデルであり、疎性誘導前駆体を持つ。
BBMFは、患者サブセットと反復的に調整された染色体アームを繋ぐ、解釈可能な小セットを見つける。
- 参考スコア(独自算出の注目度): 0.30586855806896035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Binary data factorization is common, but real-valued methods ignore discreteness and yield hard-to-interpret factors. Boolean Matrix Factorization (BooMF) instead decomposes a binary matrix into two lower-rank binary matrices via logical AND and OR, expressing the data as a Boolean disjunction of interpretable patterns. In cancer genomics, BooMF can reveal coordinated feature changes that may drive tumor evolution, unlike rotational or additive decompositions. Most existing BooMF methods are heuristic, greedy, sensitive to initialization, prone to local optima, and do not support principled model selection or uncertainty quantification. We introduce Bayesian Boolean Matrix Factorization (BBMF), a fully conjugate generative model with sparsity-inducing priors. It enforces Boolean constraints, yields interpretable latent factors with coherent uncertainty quantification, and admits Gibbs sampling with closed-form full conditionals. Because cancer evolution often involves widespread, near-simultaneous chromosome-number changes (e.g., whole-genome duplication followed by instability and selection), Boolean factorizations capture these patterns more naturally than additive models. Applied to arm-level copy-number alteration data in multiple myeloma, where entries indicate presence/absence of chromosomal-arm amplifications, BBMF finds a small set of interpretable bicliques linking patient subsets to recurrently co-altered chromosomal arms, providing a compact, biologically meaningful summary of tumor heterogeneity and demonstrating BBMF's utility for uncovering discrete latent structure in complex binary data.
- Abstract(参考訳): バイナリデータの分解は一般的であるが、実際の評価手法は離散性を無視し、解釈しにくい因子を生じる。
ブール行列因子化(Boolean Matrix Factorization, BooMF)は、論理的ANDとORによって2つの下位2進行列に分解し、そのデータを解釈可能なパターンのブール解離として表現する。
がんゲノム学では、BooMFは、回転や付加的な分解とは異なり、腫瘍の進化を引き起こす可能性のある、協調した特徴変化を明らかにすることができる。
既存のBooMF法の多くはヒューリスティックで欲求的で、初期化に敏感で、局所最適傾向があり、原理化されたモデル選択や不確実性定量化をサポートしない。
疎性誘導前駆体を用いた完全共役生成モデルであるBayes Boolean Matrix Factorization (BBMF)を紹介する。
ブール制約を強制し、コヒーレントな不確実量化を伴う解釈可能な潜在因子を与え、閉形式完全条件付きギブスサンプリングを認める。
がんの進化はしばしば、ほぼ同時な染色体数の変化(例えば、全ゲノム重複と不安定と選択)を伴うため、ブール因子化は、付加的なモデルよりも自然にこれらのパターンを捉える。
BBMFは、複数の骨髄腫における腕レベルコピー数の変化データに適用し、この項目は染色体腕増幅の存在/存在を示す。BBMFは、患者サブセットを反復的に調整された染色体アームにリンクする小さな解釈可能な双斜めのセットを発見し、腫瘍の不均一性のコンパクトで生物学的に意味のある要約を提供し、複雑なバイナリーデータ中の離散潜在構造を明らかにするためのBBMFの有用性を示す。
関連論文リスト
- Influence-Guided Symbolic Regression: Scientific Discovery via LLM-Driven Equation Search with Granular Feedback [56.69850045068714]
逐次的2段階プロセスとして方程式発見をフレーム化する方法である textitInfluence-Guided Regression (IGSR) を導入する。
LLM-SRBench, 薬理学的PKPDモデル, 疫学シミュレーション, 実世界のゲノムデータなど, IGSRの有効性を示す。
論文 参考訳(メタデータ) (2026-05-27T23:48:01Z) - MAT-Cell: A Multi-Agent Tree-Structured Reasoning Framework for Batch-Level Single-Cell Annotation [81.82645086402366]
MAT-Cellは,単細胞解析を構築的で検証可能な証明生成に再構成する,ニューロシンボリック推論フレームワークである。
MAT-Cellは、適応型レトリーバル増強生成(RAG)を通じて、生物学的公理の基底神経推論に象徴的な制約を注入し、転写ノイズを減少させる。
最先端のSOTA(State-of-the-art)モデルを大幅に上回り、挑戦的なシナリオにおいて堅牢なパフォーマンスを維持します。
論文 参考訳(メタデータ) (2026-04-07T04:56:06Z) - scDFM: Distributional Flow Matching Model for Robust Single-Cell Perturbation Prediction [12.48933770510505]
条件付きフローマッチングに基づく生成フレームワークである scDFM を提案する。
scDFMは、細胞レベルでの通信以上の個体群を混乱させ、制御する。
論文 参考訳(メタデータ) (2026-02-06T17:00:21Z) - Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Scalable Single-Cell Gene Expression Generation with Latent Diffusion Models [11.343106383645441]
単一細胞遺伝子発現データに対してスケーラブルな潜伏拡散モデルを導入し、これを scLDM と呼ぶ。
観測および摂動単細胞データおよびセルレベルの分類などの下流タスクにおいて,様々な実験において,その優れた性能を示す。
論文 参考訳(メタデータ) (2025-11-04T20:44:12Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - Generative inpainting of incomplete Euclidean distance matrices of trajectories generated by a fractional Brownian motion [46.1232919707345]
フラクショナルブラウン運動(fBm)はランダム性と強いスケールフリーの相関を特徴とする。
本稿では, 劣化した画像の特定のデータセット上で, 拡散に基づく塗布方法の動物園について検討する。
条件拡散生成は、異なるメモリ状態におけるfBmパスの組込み相関を容易に再現する。
論文 参考訳(メタデータ) (2024-04-10T14:22:16Z) - Binary Matrix Factorisation and Completion via Integer Programming [3.4376560669160394]
ランク-k二元行列分解問題(k-BMF)に対するコンパクトかつ2つの指数サイズの整数プログラム(IP)を提案する。
コンパクトIPはLP緩和が弱いのに対し,指数サイズのLPはLP緩和が強いことを示す。
論文 参考訳(メタデータ) (2021-06-25T05:17:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。