論文の概要: Terrier: A Deep Learning Repeat Classifier
- arxiv url: http://arxiv.org/abs/2503.09312v1
- Date: Wed, 12 Mar 2025 12:03:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:38:22.739277
- Title: Terrier: A Deep Learning Repeat Classifier
- Title(参考訳): Terrier: ディープラーニングの繰り返し分類器
- Authors: Robert Turnbull, Neil D. Young, Edoardo Tescari, Lee F. Skerratt, Tiffany A. Kosch,
- Abstract要約: Terrierは反復的なDNA配列を分類するために設計されたディープラーニングモデルである。
RepBaseシーケンスの97.1%をRepeatMaskerカテゴリにマッピングする。
より広い範囲のシーケンスを分類しながら、より優れた精度を実現した。
- 参考スコア(独自算出の注目度): 6.291443816903801
- License:
- Abstract: Repetitive DNA sequences underpin genome architecture and evolutionary processes, yet they remain challenging to classify accurately. Terrier is a deep learning model designed to overcome these challenges by classifying repetitive DNA sequences using a publicly available, curated repeat sequence library trained under the RepeatMasker schema. Existing tools often struggle to classify divergent taxa due to biases in reference libraries, limiting our understanding of repeat evolution and function. Terrier overcomes these challenges by leveraging deep learning for improved accuracy. Trained on RepBase, which includes over 100,000 repeat families -- four times more than Dfam -- Terrier maps 97.1% of RepBase sequences to RepeatMasker categories, offering the most comprehensive classification system available. When benchmarked against DeepTE, TERL, and TEclass2 in model organisms (rice and fruit flies), Terrier achieved superior accuracy while classifying a broader range of sequences. Further validation in non-model amphibian and flatworm genomes highlights its effectiveness in improving classification in non-model species, facilitating research on repeat-driven evolution, genomic instability, and phenotypic variation.
- Abstract(参考訳): 反復的なDNA配列は、ゲノムアーキテクチャと進化過程の基盤となっているが、正確な分類は困難である。
Terrierは、RepeatMaskerスキーマでトレーニングされた公開され、キュレートされた反復シーケンスライブラリを使用して、反復的なDNA配列を分類することで、これらの課題を克服するために設計されたディープラーニングモデルである。
既存のツールでは、参照ライブラリーのバイアスによる異種分類の分類に苦労することが多く、反復進化と機能に対する理解が制限される。
Terrierは、ディープラーニングを活用して精度を向上させることで、これらの課題を克服する。
TerrierはRepBaseのシーケンスの97.1%をRepeatMaskerカテゴリにマッピングし、最も包括的な分類システムを提供している。
DeepTE, TERL, TEclass2をモデル生物(ライスとフルーツハエ)でベンチマークしたところ、Terrierはより広範囲の配列を分類しながら優れた精度を達成した。
非モデル両生類およびフラットワームゲノムのさらなる検証は、非モデル種の分類を改善する効果を強調し、反復的進化、ゲノム不安定性、表現型変異の研究を促進する。
関連論文リスト
- MR-GDINO: Efficient Open-World Continual Object Detection [58.066277387205325]
本稿では,従来型,新しい,目に見えないカテゴリに一般化するために,検出器を必要とするオープンワールド連続物体検出タスクを提案する。
本稿では,検出能力を評価するためのOW-CODベンチマークを提案する。
そこで我々は,記憶と検索機構を通じて,強力な,効率的でスケーラブルなベースラインであるMR-GDINOを提案する。
論文 参考訳(メタデータ) (2024-12-20T15:22:51Z) - More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing [5.846028298833611]
Conditionally Overlapping Mixture of ExperTs (COMET) は、モジュラーでスパースなアーキテクチャを、指数関数的に重複する専門家数で誘導する一般的なディープラーニング手法である。
画像分類,言語モデリング,回帰といったタスクにおけるCOMETの有効性を示す。
論文 参考訳(メタデータ) (2024-10-10T14:58:18Z) - Fixed Random Classifier Rearrangement for Continual Learning [0.5439020425819]
視覚分類のシナリオでは、ニューラルネットワークは新しいタスクを学習した後、必然的に古いタスクの知識を忘れる。
我々はFixed Random Rearrangement (FRCR)という連続学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-23T09:43:58Z) - Deep Imbalanced Regression via Hierarchical Classification Adjustment [50.19438850112964]
コンピュータビジョンにおける回帰タスクは、しばしば、対象空間をクラスに定量化することで分類される。
トレーニングサンプルの大多数は目標値の先頭にあるが、少数のサンプルは通常より広い尾幅に分布する。
不均衡回帰タスクを解くために階層型分類器を構築することを提案する。
不均衡回帰のための新しい階層型分類調整(HCA)は,3つのタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2023-10-26T04:54:39Z) - A Noisy-Label-Learning Formulation for Immune Repertoire Classification
and Disease-Associated Immune Receptor Sequence Identification [7.619591696318021]
免疫レパートリー分類(Immune repertoire classification)は、計算生物学における最前線の研究課題である。
免疫レパートリー分類の課題を解決するために,雑音に富んだラベル学習の定式化を提案する。
サイトメガロウイルス(CMV)および癌データセットを用いた実験は,本手法の有効性と優れた性能を示す。
論文 参考訳(メタデータ) (2023-07-29T09:19:27Z) - Learning to Retrieve Passages without Supervision [58.31911597824848]
オープンドメイン質問応答(ODQA)のためのダンスレトリバーは,問合せペアの大規模データセットをトレーニングすることで,優れた性能を発揮することが示されている。
そこで本研究では,自己教師型で高密度検索が学べるかどうかを考察し,アノテーションを使わずに効果的に適用する。
論文 参考訳(メタデータ) (2021-12-14T19:18:08Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z) - Generative Feature Replay with Orthogonal Weight Modification for
Continual Learning [20.8966035274874]
生成的再生は、破滅的な忘れを和らげるために、以前のタスクの擬似データを生成し再生する有望な戦略である。
生成モデルを用いて垂直層の特徴を再現することを提案する; 2) 自己監督型補助タスクを活用して特徴の安定性をさらに向上する。
いくつかのデータセットにおける実験結果から,我々の手法は常に強力なOWMよりも大幅に改善されていることが分かる。
論文 参考訳(メタデータ) (2020-05-07T13:56:22Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。