論文の概要: Increased peak detection accuracy in over-dispersed ChIP-seq data with
supervised segmentation models
- arxiv url: http://arxiv.org/abs/2012.06848v2
- Date: Tue, 15 Dec 2020 12:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 05:13:37.056740
- Title: Increased peak detection accuracy in over-dispersed ChIP-seq data with
supervised segmentation models
- Title(参考訳): 教師付きセグメンテーションモデルを用いた過分散ChIP-seqデータのピーク検出精度の向上
- Authors: Arnaud Liehrmann, Guillem Rigaill and Toby Dylan Hocking
- Abstract要約: 制約のない複数変更点検出モデルにおいて、代替ノイズ仮定と適切な設定により、カウントデータによる過分散を低減できることを示す。
結果: 代替ノイズ仮定と適切なセットアップを備えた制約のないマルチチェンジポイント検出モデルにより、カウントデータによって表示される過分散が減少することを示した。
- 参考スコア(独自算出の注目度): 2.2559617939136505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivation: Histone modification constitutes a basic mechanism for the
genetic regulation of gene expression. In early 2000s, a powerful technique has
emerged that couples chromatin immunoprecipitation with high-throughput
sequencing (ChIP-seq). This technique provides a direct survey of the DNA
regions associated to these modifications. In order to realize the full
potential of this technique, increasingly sophisticated statistical algorithms
have been developed or adapted to analyze the massive amount of data it
generates. Many of these algorithms were built around natural assumptions such
as the Poisson one to model the noise in the count data. In this work we start
from these natural assumptions and show that it is possible to improve upon
them. Results: The results of our comparisons on seven reference datasets of
histone modifications (H3K36me3 and H3K4me3) suggest that natural assumptions
are not always realistic under application conditions. We show that the
unconstrained multiple changepoint detection model, with alternative noise
assumptions and a suitable setup, reduces the over-dispersion exhibited by
count data and turns out to detect peaks more accurately than algorithms which
rely on these natural assumptions.
- Abstract(参考訳): モチベーション:ヒストン修飾は遺伝子発現の遺伝的調節の基本的なメカニズムである。
2000年代初期には、高スループットシークエンシング(ChIP-seq)とクロマチンの免疫沈降が結合する強力な技術が出現した。
この技術はこれらの修飾に関連するDNA領域を直接調査する。
この手法の可能性を最大限に発揮するために、大量のデータを分析するために、より高度な統計アルゴリズムが開発され、応用されている。
これらのアルゴリズムの多くは、カウントデータのノイズをモデル化するpoissonのような自然仮定に基づいて構築された。
この作業では、これらの自然な仮定から始め、それらを改善することが可能であることを示します。
結果: ヒストン修飾の基準データセット(H3K36me3およびH3K4me3)との比較結果から, 自然仮定は適用条件下では必ずしも現実的とは限らないことが示唆された。
本研究では,制約のない複数の変化点検出モデル,代替ノイズ仮定と適切な設定により,カウントデータによる過分散を低減し,これらの自然な仮定に依存するアルゴリズムよりも高精度にピークを検出することを示す。
関連論文リスト
- Sparse Variational Contaminated Noise Gaussian Process Regression for
Forecasting Geomagnetic Perturbations [4.953938711401618]
本研究では,スパース変分ガウス過程(SVGP)に基づく拡張性推論アルゴリズムを提案する。
提案手法は, 人工ニューラルネットワークベースラインと比較して, 類似のカバレッジと精度の予測間隔が短いことを示す。
論文 参考訳(メタデータ) (2024-02-27T15:08:57Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Accurate generation of stochastic dynamics based on multi-model
Generative Adversarial Networks [0.0]
GAN(Generative Adversarial Networks)は、テキストや画像生成などの分野において大きな可能性を秘めている。
ここでは、格子上の原型過程に適用することにより、このアプローチを定量的に検証する。
重要なことに、ノイズにもかかわらずモデルの離散性は維持される。
論文 参考訳(メタデータ) (2023-05-25T10:41:02Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Latent Gaussian Model Boosting [0.0]
ツリーブースティングは多くのデータセットに対して優れた予測精度を示す。
シミュレーションおよび実世界のデータ実験において,既存の手法と比較して予測精度が向上した。
論文 参考訳(メタデータ) (2021-05-19T07:36:30Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。
分散による離散乗法雑音のパラメータによく現れることを示す。
最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文 参考訳(メタデータ) (2020-06-11T09:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。