論文の概要: Feature extraction using Spectral Clustering for Gene Function
Prediction
- arxiv url: http://arxiv.org/abs/2203.13551v1
- Date: Fri, 25 Mar 2022 10:17:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-28 20:41:02.531508
- Title: Feature extraction using Spectral Clustering for Gene Function
Prediction
- Title(参考訳): スペクトルクラスタリングを用いた遺伝子機能予測のための特徴抽出
- Authors: Miguel Romero, Oscar Ram\'irez, Jorge Finke, Camilo Rocha
- Abstract要約: 本稿では,クラスタ分析と階層的マルチラベル分類を組み合わせたアノテーション問題に対する,シリコアプローチの新たなアプローチを提案する。
提案手法は、世界で最も支配的かつ生産的な作物であるゼア・メイズ(Zia mays)のケーススタディに適用される。
- 参考スコア(独自算出の注目度): 0.4492444446637856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gene annotation addresses the problem of predicting unknown associations
between gene and functions (e.g., biological processes) of a specific organism.
Despite recent advances, the cost and time demanded by annotation procedures
that rely largely on in vivo biological experiments remain prohibitively high.
This paper presents a novel in silico approach for to the annotation problem
that combines cluster analysis and hierarchical multi-label classification
(HMC). The approach uses spectral clustering to extract new features from the
gene co-expression network (GCN) and enrich the prediction task. HMC is used to
build multiple estimators that consider the hierarchical structure of gene
functions. The proposed approach is applied to a case study on Zea mays, one of
the most dominant and productive crops in the world. The results illustrate how
in silico approaches are key to reduce the time and costs of gene annotation.
More specifically, they highlight the importance of: (i) building new features
that represent the structure of gene relationships in GCNs to annotate genes;
and (ii) taking into account the structure of biological processes to obtain
consistent predictions.
- Abstract(参考訳): 遺伝子アノテーションは、特定の生物の遺伝子と機能(例えば生物学的過程)の間の未知の関連を予測する問題に対処する。
近年の進歩にもかかわらず、生物学的実験に大きく依存するアノテーションの手順によって要求されるコストと時間は非常に高いままである。
本稿では,クラスタ分析と階層型マルチラベル分類(HMC)を組み合わせたアノテーション問題に対する,シリコアプローチの新たなアプローチを提案する。
このアプローチでは、スペクトルクラスタリングを使用して、遺伝子共発現ネットワーク(GCN)から新機能を抽出し、予測タスクを充実させる。
hmcは遺伝子機能の階層構造を考える複数の推定子を構築するために用いられる。
提案手法は,世界で最も支配的かつ生産的な作物のひとつであるゼア・メイの事例研究に適用できる。
この結果は、遺伝子アノテーションの時間とコストを削減するために、シリコアプローチがいかに重要かを示している。
より具体的に言うと、彼らはその重要性を強調している。
一 遺伝子アノテートのためのGCNにおける遺伝子関係の構造を表す新しい特徴の構築、及び
(ii)生物過程の構造を考慮して、一貫した予測を得る。
関連論文リスト
- Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - FGBERT: Function-Driven Pre-trained Gene Language Model for Metagenomics [35.47381119898764]
タンパク質をベースとした遺伝子表現をコンテキスト認識および構造関連トークン化剤として導入する。
MGMとTEM-CLは1億のメダゲノミクス配列を事前訓練した新しいメダゲノミクス言語モデルであるNAMEを構成する。
論文 参考訳(メタデータ) (2024-02-24T13:13:17Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Genetic prediction of quantitative traits: a machine learner's guide
focused on height [0.0]
本稿では,機械学習コミュニティにおけるアートモデルの現状と関連する微妙さについて概観する。
heightを連続評価された表現型の例として使用し、ベンチマークデータセット、共同創設者、機能選択、一般的なメトリクスを紹介します。
論文 参考訳(メタデータ) (2023-10-06T05:43:50Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - Hierarchy exploitation to detect missing annotations on hierarchical
multi-label classification [0.1749935196721634]
階層型マルチラベル分類データセットにおけるアノテーションの欠落を検出する手法を提案する。
本稿では,各インスタンスの葉から根へのクラスパスに対する集約確率を計算することによって,クラス階層を利用する手法を提案する。
様々な米であるOriza sativa Japonicaの実験では、クラスの階層をこの方法に組み込むことで、予測性能が向上することが示された。
論文 参考訳(メタデータ) (2022-07-13T14:32:50Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z) - Mining Functionally Related Genes with Semi-Supervised Learning [0.0]
我々は、豊富な機能セットを導入し、半教師付き学習アプローチとともにそれらを使用する。
正およびラベルなし例(LPU)による学習の枠組みは機能的関連遺伝子のマイニングに特に適していることが示されている。
論文 参考訳(メタデータ) (2020-11-05T20:34:09Z) - Complexity-based speciation and genotype representation for
neuroevolution [81.21462458089142]
本稿では、進化するネットワークを隠されたニューロンの数に基づいて種に分類する神経進化の種分化原理を提案する。
提案された種分化原理は、種および生態系全体における多様性の促進と保存を目的として設計されたいくつかの技術で採用されている。
論文 参考訳(メタデータ) (2020-10-11T06:26:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。