Fugu-MT 論文翻訳(概要): GeneFormer: Learned Gene Compression using Transformer-based Context Modeling

論文の概要: GeneFormer: Learned Gene Compression using Transformer-based Context Modeling

arxiv url: http://arxiv.org/abs/2212.08379v1
Date: Fri, 16 Dec 2022 10:12:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-19 16:23:24.301618
Title: GeneFormer: Learned Gene Compression using Transformer-based Context Modeling
Title（参考訳）: geneformer:transformerベースのコンテキストモデリングを用いた学習型遺伝子圧縮
Authors: Zhanbei Cui, Yu Liao, Tongda Xu, Yan Wang
Abstract要約: そこで我々はGeneFormerというトランスフォーマーに基づく遺伝子圧縮手法を提案する。実世界のデータセットを用いた実験結果から,本手法は最先端手法と比較して29.7%のビットレートを節約できることがわかった。
参考スコア（独自算出の注目度）: 4.703890350754107
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the development of gene sequencing technology, an explosive growth of gene data has been witnessed. And the storage of gene data has become an important issue. Traditional gene data compression methods rely on general software like G-zip, which fails to utilize the interrelation of nucleotide sequence. Recently, many researchers begin to investigate deep learning based gene data compression method. In this paper, we propose a transformer-based gene compression method named GeneFormer. Specifically, we first introduce a modified transformer structure to fully explore the nucleotide sequence dependency. Then, we propose fixed-length parallel grouping to accelerate the decoding speed of our autoregressive model. Experimental results on real-world datasets show that our method saves 29.7% bit rate compared with the state-of-the-art method, and the decoding speed is significantly faster than all existing learning-based gene compression methods.
Abstract（参考訳）: 遺伝子シークエンシング技術の発展に伴い、遺伝子データの爆発的な成長が見られた。そして、遺伝子データの保存は重要な問題となっている。従来の遺伝子データ圧縮法はG-zipのような一般的なソフトウェアに依存しており、ヌクレオチド配列の相互関係を利用できない。近年,深層学習に基づく遺伝子データ圧縮法が研究されている。本稿では,GeneFormerというトランスフォーマーを用いた遺伝子圧縮手法を提案する。具体的には、まず、ヌクレオチド配列依存を完全に探求するために、修正トランスフォーマー構造を導入する。そこで我々は,自己回帰モデルの復号速度を高速化する固定長並列グルーピングを提案する。実世界のデータセットを用いた実験の結果,本手法は最先端法に比べて29.7%のビットレートを節約でき,既存の学習系遺伝子圧縮法に比べて復号速度は著しく速いことがわかった。

関連論文リスト

GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文参考訳（メタデータ） (2025-05-06T03:35:24Z)
DNAZEN: Enhanced Gene Sequence Representations via Mixed Granularities of Coding Units [18.113659670915474]
ゲノムモデリングは、伝統的に遺伝子配列を言語として扱い、その構造的モチーフと言語単位や組織原理に類似した長距離依存を反映している。遺伝子配列の様々な粒度から学習するための改良されたゲノム表現フレームワークであるDNAZENを提案する。トランスフォーマーベースのG-gramエンコーダも提案され、一致したG-gramを入力して表現を計算し、基本単位のエンコーダに統合する。
論文参考訳（メタデータ） (2025-05-04T18:02:28Z)
Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。 2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文参考訳（メタデータ） (2025-03-11T02:33:33Z)
Learning to Discover Regulatory Elements for Gene Expression Prediction [59.470991831978516]
Seq2Expは、ターゲット遺伝子発現を駆動する制御要素を発見し、抽出するために設計されたSequence to Expressionネットワークである。本手法は, エピジェノミックシグナル, DNA 配列とその関連因子の因果関係を捉える。
論文参考訳（メタデータ） (2025-02-19T03:25:49Z)
GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images [41.732831871866516]
全スライディングヘマトキシリンとエオシン染色組織像は容易にアクセスでき、顕微鏡レベルで組織構造と組成を詳細に調べることができる。近年の進歩は、これらの組織像を利用して、空間的に解決された遺伝子発現プロファイルを予測している。 GeneQueryは、この遺伝子発現予測タスクを質問応答(QA)方式で解決し、より汎用性と柔軟性を向上させることを目的としている。
論文参考訳（メタデータ） (2024-11-27T14:33:13Z)
An Evolutional Neural Network Framework for Classification of Microarray Data [0.0]
本研究の目的は,遺伝的アルゴリズムとニューラルネットワークのハイブリッドモデルを用いて,情報的遺伝子のサブセット選択において問題を克服することである。実験の結果,提案手法は,他の機械学習アルゴリズムと比較して,高い精度と最小数の選択遺伝子が示唆された。
論文参考訳（メタデータ） (2024-11-20T13:48:40Z)
Weighted Diversified Sampling for Efficient Data-Driven Single-Cell Gene-Gene Interaction Discovery [56.622854875204645]
本稿では,遺伝子・遺伝子相互作用の探索に先進的なトランスフォーマーモデルを活用する,データ駆動型計算ツールを活用した革新的なアプローチを提案する。新たな重み付き多様化サンプリングアルゴリズムは、データセットのたった2パスで、各データサンプルの多様性スコアを算出する。
論文参考訳（メタデータ） (2024-10-21T03:35:23Z)
Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。 BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。 BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文参考訳（メタデータ） (2024-06-05T06:42:27Z)
DNA Sequence Classification with Compressors [0.0]
本研究は,DNA配列解析に適した圧縮機を用いたパラメータフリー分類法を新たに導入する。この手法は、精度の観点から現在の最先端と整合するだけでなく、従来の機械学習手法よりもリソース効率の良い代替手段を提供する。
論文参考訳（メタデータ） (2024-01-25T09:17:19Z)
GENER: A Parallel Layer Deep Learning Network To Detect Gene-Gene Interactions From Gene Expression Data [0.7660368798066375]
本稿では,遺伝子発現データを用いた遺伝子関係の同定専用に設計された並列層深層学習ネットワークを提案する。本モデルでは,BioGRIDとDREAM5の組み合わせによる平均AUROCスコア0.834を達成し,遺伝子間相互作用を予測する競合手法よりも優れていた。
論文参考訳（メタデータ） (2023-10-05T15:45:53Z)
Machine Learning Methods for Cancer Classification Using Gene Expression Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。遺伝子発現は癌の早期発見において基本的な役割を担っている。本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文参考訳（メタデータ） (2023-01-28T15:03:03Z)
Natural language processing for clusterization of genes according to their functions [62.997667081978825]
本稿では,数千の遺伝子の解析を減らし,複数のクラスタの解析を行うアプローチを提案する。これらの記述は、事前訓練された言語モデル(BERT)といくつかのテキスト処理アプローチを用いてベクトルとして符号化される。
論文参考訳（メタデータ） (2022-07-17T12:59:34Z)
Deep metric learning improves lab of origin prediction of genetically engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文参考訳（メタデータ） (2021-11-24T16:29:03Z)
SimpleChrome: Encoding of Combinatorial Effects for Predicting Gene Expression [8.326669256957352]
遺伝子のヒストン修飾表現を学習するディープラーニングモデルであるSimpleChromeを紹介します。このモデルから得られた特徴により、遺伝子間相互作用の潜在効果と標的遺伝子の発現に対する直接遺伝子調節をよりよく理解することができます。
論文参考訳（メタデータ） (2020-12-15T23:30:36Z)
Mining Functionally Related Genes with Semi-Supervised Learning [0.0]
我々は、豊富な機能セットを導入し、半教師付き学習アプローチとともにそれらを使用する。正およびラベルなし例(LPU)による学習の枠組みは機能的関連遺伝子のマイニングに特に適していることが示されている。
論文参考訳（メタデータ） (2020-11-05T20:34:09Z)
A Novel Granular-Based Bi-Clustering Method of Deep Mining the Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文参考訳（メタデータ） (2020-05-12T02:04:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。