論文の概要: Doubly Non-Central Beta Matrix Factorization for DNA Methylation Data
- arxiv url: http://arxiv.org/abs/2106.06691v1
- Date: Sat, 12 Jun 2021 05:36:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 16:19:20.908239
- Title: Doubly Non-Central Beta Matrix Factorization for DNA Methylation Data
- Title(参考訳): DNAメチル化データの二重非中心ベータマトリックス分解
- Authors: Aaron Schein, Anjali Nagulpally, Hanna Wallach, Patrick Flaherty
- Abstract要約: 我々は$(0,1)$bounded- supportedデータに対する新しい非負行列分解モデルを提案する。
モデル構造は十分に一般であり、他の多くの領域に適応できる。
我々のモデルは、既存の生物学的知識に対応する有意義な潜伏表現をもたらす。
- 参考スコア(独自算出の注目度): 2.924868086534434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new non-negative matrix factorization model for $(0,1)$
bounded-support data based on the doubly non-central beta (DNCB) distribution,
a generalization of the beta distribution. The expressiveness of the DNCB
distribution is particularly useful for modeling DNA methylation datasets,
which are typically highly dispersed and multi-modal; however, the model
structure is sufficiently general that it can be adapted to many other domains
where latent representations of $(0,1)$ bounded-support data are of interest.
Although the DNCB distribution lacks a closed-form conjugate prior, several
augmentations let us derive an efficient posterior inference algorithm composed
entirely of analytic updates. Our model improves out-of-sample predictive
performance on both real and synthetic DNA methylation datasets over
state-of-the-art methods in bioinformatics. In addition, our model yields
meaningful latent representations that accord with existing biological
knowledge.
- Abstract(参考訳): ベータ分布の一般化である2つの非中央ベータ(DNCB)分布に基づく,$(0,1)$境界付きサポートデータに対する新しい非負行列分解モデルを提案する。
DNCB分布の表現性はDNAメチル化データセットをモデル化するのに特に有用であるが、モデル構造は、(0,1)$有界支持データの潜在表現が興味のある他の多くの領域に適応できるほど一般的である。
DNCB分布は以前に閉形式共役を欠いていたが、いくつかの拡張により、完全に解析的更新からなる効率的な後部推論アルゴリズムを導出することができた。
本モデルでは, バイオインフォマティクスにおける最先端手法よりも, 実および合成dnaメチル化データセットの予測性能が向上する。
さらに,本モデルでは,既存の生物学的知識に合致した有意義な潜在表現を導出する。
関連論文リスト
- Constrained Diffusion Models via Dual Training [80.03953599062365]
拡散プロセスは、トレーニングデータセットのバイアスを反映したサンプルを生成する傾向がある。
所望の分布に基づいて拡散制約を付与し,制約付き拡散モデルを構築する。
本稿では,制約付き拡散モデルを用いて,目的と制約の最適なトレードオフを実現する混合データ分布から新しいデータを生成することを示す。
論文 参考訳(メタデータ) (2024-08-27T14:25:42Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Transfer Learning for Diffusion Models [43.10840361752551]
拡散モデルは高品質な合成サンプルを一貫して生成する。
コレクションコストや関連するリスクのため、現実のアプリケーションでは実用的ではありません。
本稿では,従来の微調整法や正規化法とは異なる新しいアプローチであるTransfer Guided Diffusion Process (TGDP)を紹介する。
論文 参考訳(メタデータ) (2024-05-27T06:48:58Z) - Generative inpainting of incomplete Euclidean distance matrices of trajectories generated by a fractional Brownian motion [46.1232919707345]
フラクショナルブラウン運動(fBm)はランダム性と強いスケールフリーの相関を特徴とする。
本稿では, 劣化した画像の特定のデータセット上で, 拡散に基づく塗布方法の動物園について検討する。
条件拡散生成は、異なるメモリ状態におけるfBmパスの組込み相関を容易に再現する。
論文 参考訳(メタデータ) (2024-04-10T14:22:16Z) - Toward the Identifiability of Comparative Deep Generative Models [7.5479347719819865]
比較深部生成モデル(DGM)における識別可能性の理論を提案する。
これらのモデルは、一般的な混合関数のクラスにおいて識別性に欠けるが、混合関数が断片的アフィンであるときに驚くほど識別可能であることを示す。
また, モデルミス種別の影響についても検討し, 従来提案されていた比較DGMの正則化手法が, 潜伏変数の数が事前に分かっていない場合に, 識別可能性を高めることを実証的に示す。
論文 参考訳(メタデータ) (2024-01-29T06:10:54Z) - Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。