論文の概要: Comprehensive survey of computational learning methods for analysis of
gene expression data in genomics
- arxiv url: http://arxiv.org/abs/2202.02958v2
- Date: Wed, 9 Feb 2022 15:51:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 13:47:46.771850
- Title: Comprehensive survey of computational learning methods for analysis of
gene expression data in genomics
- Title(参考訳): ゲノミクスにおける遺伝子発現データ解析のための計算学習法の包括的調査
- Authors: Nikita Bhandari, Rahee Walambe, Ketan Kotecha, Satyajeet Khare
- Abstract要約: 機械学習を含む計算解析手法は、ゲノム学や医学の分野で大きな影響を与えている。
本稿では,表現マイクロアレイデータの解析に使用される様々な統計・計算ツールについて概説する。
具体的には,不備な値(遺伝子発現)の計算方法,特徴遺伝子のスケーリング,次元減少のための特徴の選択と抽出,表現データの学習と解析について論じる。
- 参考スコア(独自算出の注目度): 7.717214217542406
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational analysis methods including machine learning have a significant
impact in the fields of genomics and medicine. High-throughput gene expression
analysis methods such as microarray technology and RNA sequencing produce
enormous amounts of data. Traditionally, statistical methods are used for
comparative analysis of the gene expression data. However, more complex
analysis for classification and discovery of feature genes or sample
observations requires sophisticated computational approaches. In this review,
we compile various statistical and computational tools used in analysis of
expression microarray data. Even though, the methods are discussed in the
context of expression microarray data, they can also be applied for the
analysis of RNA sequencing or quantitative proteomics datasets. We specifically
discuss methods for missing value (gene expression) imputation, feature gene
scaling, selection and extraction of features for dimensionality reduction, and
learning and analysis of expression data. We discuss the types of missing
values and the methods and approaches usually employed in their imputation. We
also discuss methods of data transformation and feature scaling viz.
normalization and standardization. Various approaches used in feature selection
and extraction are also reviewed. Lastly, learning and analysis methods
including class comparison, class prediction, and class discovery along with
their evaluation parameters are described in detail. We have described the
process of generation of a microarray gene expression data along with
advantages and limitations of the above-mentioned techniques. We believe that
this detailed review will help the users to select appropriate methods based on
the type of data and the expected outcome.
- Abstract(参考訳): 機械学習を含む計算分析手法は、ゲノム学や医学の分野に大きな影響を与えている。
マイクロアレイ技術やRNAシークエンシングなどの高スループット遺伝子発現解析手法は膨大な量のデータを生成する。
伝統的に、統計的手法は遺伝子発現データの比較分析に用いられる。
しかし、特徴遺伝子の分類と発見のためのより複雑な分析やサンプル観察には高度な計算手法が必要である。
本稿では,表現マイクロアレイデータの解析に用いられる各種統計・計算ツールについて概説する。
これらの手法は, 発現マイクロアレイデータの文脈で論じられているが, RNAシークエンシングや定量プロテオミクスデータセットの解析にも応用できる。
具体的には,不備値(遺伝子発現)の計算方法,特徴遺伝子のスケーリング,次元減少のための特徴の選択と抽出,表現データの学習と解析について論じる。
欠落する値の型と、通常そのインプテーションで使われるメソッドとアプローチについて論じる。
また、データ変換の手法や特徴スケーリングの手法についても論じる。
特徴選択や抽出に用いられる様々なアプローチも検討されている。
最後に、クラス比較、クラス予測、クラス発見を含む学習および分析方法とその評価パラメータについて詳述する。
以上の手法の利点と限界とともに,マイクロアレイ遺伝子発現データの生成プロセスについて述べる。
この詳細なレビューは、ユーザがデータの種類と期待される結果に基づいて適切な方法を選択するのに役立つと信じています。
関連論文リスト
- Robust Multi-view Co-expression Network Inference [8.697303234009528]
トランスクリプトームデータから遺伝子共発現ネットワークを推定することは、多くの課題をもたらす。
複数の独立研究から高次元グラフ推論のためのロバストな手法を提案する。
論文 参考訳(メタデータ) (2024-09-30T06:30:09Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - RandomSCM: interpretable ensembles of sparse classifiers tailored for
omics data [59.4141628321618]
決定規則の結合や解離に基づくアンサンブル学習アルゴリズムを提案する。
モデルの解釈可能性により、高次元データのバイオマーカー発見やパターン発見に有用である。
論文 参考訳(メタデータ) (2022-08-11T13:55:04Z) - Natural language processing for clusterization of genes according to
their functions [62.997667081978825]
本稿では,数千の遺伝子の解析を減らし,複数のクラスタの解析を行うアプローチを提案する。
これらの記述は、事前訓練された言語モデル(BERT)といくつかのテキスト処理アプローチを用いてベクトルとして符号化される。
論文 参考訳(メタデータ) (2022-07-17T12:59:34Z) - Using ontology embeddings for structural inductive bias in gene
expression data analysis [6.587739898387445]
がん患者の遺伝子発現レベルに基づいて、診断、生存分析、治療計画を改善することができる。
本稿では,遺伝子発現データから患者の分類作業を行う機械学習システムに,遺伝子に関する生物学的知識を取り入れることを提案する。
論文 参考訳(メタデータ) (2020-11-22T12:13:29Z) - Mining Functionally Related Genes with Semi-Supervised Learning [0.0]
我々は、豊富な機能セットを導入し、半教師付き学習アプローチとともにそれらを使用する。
正およびラベルなし例(LPU)による学習の枠組みは機能的関連遺伝子のマイニングに特に適していることが示されている。
論文 参考訳(メタデータ) (2020-11-05T20:34:09Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A generalised OMP algorithm for feature selection with application to
gene expression data [1.969028842568933]
分子データに適用するには、機能選択アルゴリズムは数万の利用可能な機能にスケーラブルである必要がある。
本稿では,Orthogonal Matching Pursuit特徴選択アルゴリズムの高度にスケール可能な一般化であるgOMPを提案する。
論文 参考訳(メタデータ) (2020-04-01T08:33:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。