論文の概要: Genomic Interpreter: A Hierarchical Genomic Deep Neural Network with 1D
Shifted Window Transformer
- arxiv url: http://arxiv.org/abs/2306.05143v2
- Date: Wed, 28 Jun 2023 08:17:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 17:33:45.511352
- Title: Genomic Interpreter: A Hierarchical Genomic Deep Neural Network with 1D
Shifted Window Transformer
- Title(参考訳): Genomic Interpreter: 1Dシフトウィンドウトランスを備えた階層型ゲノムディープニューラルネットワーク
- Authors: Zehui Li, Akashaditya Das, William A V Beardall, Yiren Zhao, Guy-Bart
Stan
- Abstract要約: Genomic Interpreterはゲノムアッセイ予測のための新しいアーキテクチャである。
モデルはゲノムサイトの階層的依存関係を識別できる。
17K対の38,171のDNAセグメントを含むデータセットで評価される。
- 参考スコア(独自算出の注目度): 4.059849656394191
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given the increasing volume and quality of genomics data, extracting new
insights requires interpretable machine-learning models. This work presents
Genomic Interpreter: a novel architecture for genomic assay prediction. This
model outperforms the state-of-the-art models for genomic assay prediction
tasks. Our model can identify hierarchical dependencies in genomic sites. This
is achieved through the integration of 1D-Swin, a novel Transformer-based block
designed by us for modelling long-range hierarchical data. Evaluated on a
dataset containing 38,171 DNA segments of 17K base pairs, Genomic Interpreter
demonstrates superior performance in chromatin accessibility and gene
expression prediction and unmasks the underlying `syntax' of gene regulation.
- Abstract(参考訳): ゲノムデータの量と質の増大を考えると、新しい洞察の抽出には解釈可能な機械学習モデルが必要である。
本研究はゲノム解析予測のための新しいアーキテクチャであるゲノム解釈を提示する。
このモデルは、ゲノムアッセイ予測タスクの最先端モデルを上回る。
我々のモデルはゲノム部位の階層的依存関係を識別できる。
これは、我々が長距離階層データをモデル化するために設計した、新しいトランスフォーマーベースのブロックである1d-swinの統合によって実現されている。
ゲノムインタプターは17K塩基対の38,171のDNAセグメントを含むデータセットに基づいて評価され、クロマチンアクセシビリティと遺伝子発現予測において優れた性能を示し、遺伝子制御の基礎となる「シンタクス」を解き放つ。
関連論文リスト
- FGBERT: Function-Driven Pre-trained Gene Language Model for Metagenomics [35.47381119898764]
タンパク質をベースとした遺伝子表現をコンテキスト認識および構造関連トークン化剤として導入する。
MGMとTEM-CLは1億のメダゲノミクス配列を事前訓練した新しいメダゲノミクス言語モデルであるNAMEを構成する。
論文 参考訳(メタデータ) (2024-02-24T13:13:17Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Text Representation Enrichment Utilizing Graph based Approaches: Stock
Market Technical Analysis Case Study [0.0]
本稿では,教師なしノード表現学習モデルとノード分類/エッジ予測モデルを組み合わせたトランスダクティブハイブリッド手法を提案する。
提案手法は,この分野における最初の研究である株式市場の技術分析報告を分類するために開発された。
論文 参考訳(メタデータ) (2022-11-29T11:26:08Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Self-Supervised Graph Representation Learning for Neuronal Morphologies [75.38832711445421]
ラベルのないデータセットから3次元神経形態の低次元表現を学習するためのデータ駆動型アプローチであるGraphDINOを提案する。
2つの異なる種と複数の脳領域において、この方法では、専門家による手動の特徴に基づく分類と同程度に形態学的細胞型クラスタリングが得られることを示す。
提案手法は,大規模データセットにおける新しい形態的特徴や細胞型の発見を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - Epigenomic language models powered by Cerebras [0.0]
エピゲノムBERT(またはEBERT)は、DNA配列とペア化されたエピジェネティック状態の入力の両方に基づいて表現を学習する。
細胞型特異的転写因子結合予測タスクにおいて,EBERTの転写学習能力を示す。
ENCODE-DREAMベンチマークから得られた13つの評価データセットのうち4つは、我々の微調整されたモデルであり、挑戦のリーダーボードでは総合3位である。
論文 参考訳(メタデータ) (2021-12-14T17:23:42Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Using ontology embeddings for structural inductive bias in gene
expression data analysis [6.587739898387445]
がん患者の遺伝子発現レベルに基づいて、診断、生存分析、治療計画を改善することができる。
本稿では,遺伝子発現データから患者の分類作業を行う機械学習システムに,遺伝子に関する生物学的知識を取り入れることを提案する。
論文 参考訳(メタデータ) (2020-11-22T12:13:29Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。