論文の概要: Increased peak detection accuracy in over-dispersed ChIP-seq data with
supervised segmentation models
- arxiv url: http://arxiv.org/abs/2012.06848v2
- Date: Tue, 15 Dec 2020 12:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 05:13:37.056740
- Title: Increased peak detection accuracy in over-dispersed ChIP-seq data with
supervised segmentation models
- Title(参考訳): 教師付きセグメンテーションモデルを用いた過分散ChIP-seqデータのピーク検出精度の向上
- Authors: Arnaud Liehrmann, Guillem Rigaill and Toby Dylan Hocking
- Abstract要約: 制約のない複数変更点検出モデルにおいて、代替ノイズ仮定と適切な設定により、カウントデータによる過分散を低減できることを示す。
結果: 代替ノイズ仮定と適切なセットアップを備えた制約のないマルチチェンジポイント検出モデルにより、カウントデータによって表示される過分散が減少することを示した。
- 参考スコア(独自算出の注目度): 2.2559617939136505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivation: Histone modification constitutes a basic mechanism for the
genetic regulation of gene expression. In early 2000s, a powerful technique has
emerged that couples chromatin immunoprecipitation with high-throughput
sequencing (ChIP-seq). This technique provides a direct survey of the DNA
regions associated to these modifications. In order to realize the full
potential of this technique, increasingly sophisticated statistical algorithms
have been developed or adapted to analyze the massive amount of data it
generates. Many of these algorithms were built around natural assumptions such
as the Poisson one to model the noise in the count data. In this work we start
from these natural assumptions and show that it is possible to improve upon
them. Results: The results of our comparisons on seven reference datasets of
histone modifications (H3K36me3 and H3K4me3) suggest that natural assumptions
are not always realistic under application conditions. We show that the
unconstrained multiple changepoint detection model, with alternative noise
assumptions and a suitable setup, reduces the over-dispersion exhibited by
count data and turns out to detect peaks more accurately than algorithms which
rely on these natural assumptions.
- Abstract(参考訳): モチベーション:ヒストン修飾は遺伝子発現の遺伝的調節の基本的なメカニズムである。
2000年代初期には、高スループットシークエンシング(ChIP-seq)とクロマチンの免疫沈降が結合する強力な技術が出現した。
この技術はこれらの修飾に関連するDNA領域を直接調査する。
この手法の可能性を最大限に発揮するために、大量のデータを分析するために、より高度な統計アルゴリズムが開発され、応用されている。
これらのアルゴリズムの多くは、カウントデータのノイズをモデル化するpoissonのような自然仮定に基づいて構築された。
この作業では、これらの自然な仮定から始め、それらを改善することが可能であることを示します。
結果: ヒストン修飾の基準データセット(H3K36me3およびH3K4me3)との比較結果から, 自然仮定は適用条件下では必ずしも現実的とは限らないことが示唆された。
本研究では,制約のない複数の変化点検出モデル,代替ノイズ仮定と適切な設定により,カウントデータによる過分散を低減し,これらの自然な仮定に依存するアルゴリズムよりも高精度にピークを検出することを示す。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。
本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文 参考訳(メタデータ) (2024-09-03T09:14:21Z) - Conditionally-Conjugate Gaussian Process Factor Analysis for Spike Count Data via Data Augmentation [8.114880112033644]
近年、GPFAはスパイクカウントデータをモデル化するために拡張されている。
本稿では,解析的および計算的抽出可能な推論が可能な条件共役型ガウス過程因子解析(ccGPFA)を提案する。
論文 参考訳(メタデータ) (2024-05-19T21:53:36Z) - Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。
本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文 参考訳(メタデータ) (2024-05-01T15:59:00Z) - Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.116832159265964]
我々は、古典因果探索アルゴリズムの出力からより大きな因果グラフを予測することを学ぶ教師付きモデルを訓練する。
我々のアプローチは、古典的手法の出力における典型的なエラーがデータセット間で比較できるという観察によって実現されている。
実データおよび合成データに関する実験では、このモデルが不特定性や分布シフトに直面して高い精度を維持することを示した。
論文 参考訳(メタデータ) (2024-02-02T21:57:58Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Latent Gaussian Model Boosting [0.0]
ツリーブースティングは多くのデータセットに対して優れた予測精度を示す。
シミュレーションおよび実世界のデータ実験において,既存の手法と比較して予測精度が向上した。
論文 参考訳(メタデータ) (2021-05-19T07:36:30Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。