論文の概要: Segmentation and genome annotation algorithms
- arxiv url: http://arxiv.org/abs/2101.00688v1
- Date: Sun, 3 Jan 2021 19:08:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 01:17:15.549845
- Title: Segmentation and genome annotation algorithms
- Title(参考訳): セグメンテーションとゲノムアノテーションアルゴリズム
- Authors: Maxwell W Libbrecht, Rachel CW Chan, Michael M Hoffman
- Abstract要約: sagaアルゴリズムはゲノム活性や遺伝子制御を理解するために広く使われている。
彼らはゲノムを分割し、同じラベルを持つ位置が入力データの類似パターンを示すように各セグメントにラベルを割り当てる。
SAGAアルゴリズムは、既知のゲノム要素の事前知識のないプロモーター、エンハンサー、または遺伝子の一部の活性のカテゴリを発見する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Segmentation and genome annotation (SAGA) algorithms are widely used to
understand genome activity and gene regulation. These algorithms take as input
epigenomic datasets, such as chromatin immunoprecipitation-sequencing
(ChIP-seq) measurements of histone modifications or transcription factor
binding. They partition the genome and assign a label to each segment such that
positions with the same label exhibit similar patterns of input data. SAGA
algorithms discover categories of activity such as promoters, enhancers, or
parts of genes without prior knowledge of known genomic elements. In this
sense, they generally act in an unsupervised fashion like clustering
algorithms, but with the additional simultaneous function of segmenting the
genome. Here, we review the common methodological framework that underlies
these methods, review variants of and improvements upon this basic framework,
catalogue existing large-scale reference annotations, and discuss the outlook
for future work.
- Abstract(参考訳): セグメンテーションとゲノムアノテーション(SAGA)アルゴリズムは、ゲノムの活性と遺伝子制御を理解するために広く使われている。
これらのアルゴリズムは、クロマチン免疫沈降シークエンシング(ChIP-sequencing, ChIP-seq)測定や転写因子の結合などの入力エピゲノムデータセットである。
彼らはゲノムを分割し、同じラベルを持つ位置が入力データの類似パターンを示すように各セグメントにラベルを割り当てる。
SAGAアルゴリズムは、既知のゲノム要素の事前知識のないプロモーター、エンハンサー、または遺伝子の一部の活性のカテゴリを発見する。
この意味では、概してクラスタリングアルゴリズムのような教師なしの方法で機能するが、同時にゲノムを分割する機能もある。
本稿では,これらの手法の根底にある共通方法論フレームワークをレビューし,この基本フレームワークの変種と改善点をレビューし,既存の大規模参照アノテーションを分類し,今後の作業の展望について考察する。
関連論文リスト
- Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - DNA Sequence Classification with Compressors [0.0]
本研究は,DNA配列解析に適した圧縮機を用いたパラメータフリー分類法を新たに導入する。
この手法は、精度の観点から現在の最先端と整合するだけでなく、従来の機械学習手法よりもリソース効率の良い代替手段を提供する。
論文 参考訳(メタデータ) (2024-01-25T09:17:19Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Using Signal Processing in Tandem With Adapted Mixture Models for
Classifying Genomic Signals [16.119729980200955]
本稿では,ガウス混合モデルとタンデムの信号処理を併用して,シーケンスのスペクトル表現を改善する手法を提案する。
提案手法は、確立されたベンチマークデータセットに対して、6.06%の精度で類似した最先端の手法より優れている。
論文 参考訳(メタデータ) (2022-11-03T06:10:55Z) - SGC: A semi-supervised pipeline for gene clustering using self-training
approach in gene co-expression networks [3.8073142980733]
本稿では,スペクトルネットワーク理論の数学に基づく遺伝子クラスタリングのための新しいパイプラインを提案する。
SGCは、教師なしの方法で高度に強化されたモジュールの計算を可能にする複数の新しいステップで構成されている。
実データにおいて,SGCが高密度化をもたらすことを示す。
論文 参考訳(メタデータ) (2022-09-21T14:51:08Z) - Multiscale methods for signal selection in single-cell data [2.683475550237718]
教師なし特徴選択のための3つのトポロジカルな数学的手法を提案する。
単細胞転写学データセットにこれらの手法を適用することで,これらの手法の有用性を実証する。
論文 参考訳(メタデータ) (2022-06-15T18:42:26Z) - Assigning Species Information to Corresponding Genes by a Sequence
Labeling Framework [7.231921004060877]
既存の手法は典型的には、本論文における遺伝子と種間の共起に基づく規則に依存している。
本研究では,新しい深層学習フレームワークを用いた高性能な手法を開発し,遺伝子と種が関係しているかどうかを分類する。
ベンチマークの結果,本手法はルールベースベースライン法と比較すると,かなり高い性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-05-08T12:39:45Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。