論文の概要: Learning complex dependency structure of gene regulatory networks from
high dimensional micro-array data with Gaussian Bayesian networks
- arxiv url: http://arxiv.org/abs/2106.15365v1
- Date: Mon, 28 Jun 2021 15:04:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 09:40:52.117944
- Title: Learning complex dependency structure of gene regulatory networks from
high dimensional micro-array data with Gaussian Bayesian networks
- Title(参考訳): ガウスベイズネットワークを用いた高次元マイクロアレイデータから遺伝子制御ネットワークの複雑な依存性構造を学ぶ
- Authors: Catharina Elisabeth Graafland and Jos\'e Manuel Guti\'errez
- Abstract要約: 遺伝子発現データセットは、比較的小さなサンプルサイズを持つ数千の遺伝子から構成される。
Glassoアルゴリズムは高次元マイクロアレイデータセットを扱うために提案されている。
既定のGlassoアルゴリズムの修正は、複雑な相互作用構造の問題を克服するために開発されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gene expression datasets consist of thousand of genes with relatively small
samplesizes (i.e. are large-$p$-small-$n$). Moreover, dependencies of various
orders co-exist in the datasets. In the Undirected probabilistic Graphical
Model (UGM) framework the Glasso algorithm has been proposed to deal with high
dimensional micro-array datasets forcing sparsity. Also, modifications of the
default Glasso algorithm are developed to overcome the problem of complex
interaction structure. In this work we advocate the use of a simple score-based
Hill Climbing algorithm (HC) that learns Gaussian Bayesian Networks (BNs)
leaning on Directed Acyclic Graphs (DAGs). We compare HC with Glasso and its
modifications in the UGM framework on their capability to reconstruct GRNs from
micro-array data belonging to the Escherichia Coli genome. We benefit from the
analytical properties of the Joint Probability Density (JPD) function on which
both directed and undirected PGMs build to convert DAGs to UGMs.
We conclude that dependencies in complex data are learned best by the HC
algorithm, presenting them most accurately and efficiently, simultaneously
modelling strong local and weaker but significant global connections coexisting
in the gene expression dataset. The HC algorithm adapts intrinsically to the
complex dependency structure of the dataset, without forcing a specific
structure in advance. On the contrary, Glasso and modifications model
unnecessary dependencies at the expense of the probabilistic information in the
network and of a structural bias in the JPD function that can only be relieved
including many parameters.
- Abstract(参考訳): 遺伝子発現データセットは、比較的少ないサンプル(すなわち)を持つ数千の遺伝子からなる。
large-$p$-small-$n$である。
さらに、データセットに様々な順序の依存関係が共存する。
In the Undirected probabilistic Graphical Model (UGM) framework, the Glasso algorithm has proposed to handle with high dimensional micro-array datasets forced sparsity。
また、複雑な相互作用構造の問題を克服するために、デフォルトのglassoアルゴリズムの修正も開発されている。
本研究では,DAG(Directed Acyclic Graphs)に頼ったガウスベイズネットワーク(BN)を学習する単純なスコアベースヒルクライミングアルゴリズム(HC)の使用を提唱する。
HCとGlassoを比較し,その改良点として,大腸菌ゲノムのマイクロアレイデータからGRNを再構成する能力について検討した。
我々は、DAGをUGMに変換するために、指向性PGMと非指向性PGMの両方が構築されるジョイント確率密度(JPD)関数の解析的性質の恩恵を受ける。
複雑なデータの依存関係はhcアルゴリズムによって最も良く学習され、最も正確かつ効率的に提示され、遺伝子発現データセットに共存する強い局所的および弱いが重要なグローバル接続を同時にモデル化する。
HCアルゴリズムは、特定の構造を事前に強制することなく、データセットの複雑な依存構造に本質的に適応する。
それとは対照的に、glassoとmodifiedsモデルは、ネットワーク内の確率的情報と多くのパラメータを含むだけで緩和できるjpd関数の構造的バイアスを犠牲にして不要な依存関係をモデル化する。
関連論文リスト
- Variable Importance in High-Dimensional Settings Requires Grouping [19.095605415846187]
Conditional Permutation Importance (CPI)は、そのような場合のPIの制限をバイパスする。
クラスタリングまたはいくつかの事前知識を介して統計的に変数をグループ化すると、ある程度のパワーバックが得られる。
重み付けにより拡張された手法は,高相関なグループであっても,型Iエラーを制御可能であることを示す。
論文 参考訳(メタデータ) (2023-12-18T00:21:47Z) - RGM: A Robust Generalist Matching Model [53.223624323416914]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Higher Order Gauge Equivariant CNNs on Riemannian Manifolds and
Applications [7.322121417864824]
我々はゲージ同変畳み込み(GEVNet)と呼ばれるゲージ同変畳み込みの高次一般化を導入する。
これにより、空間的に拡張された非線形相互作用を、大域的等距離と等値性を維持しながら、与えられた場内でモデル化することができる。
神経画像データ実験では、結果として生じる2部構造を用いて、拡散磁気共鳴画像(dMRI)からLewy Body Disease(DLB)、Alzheimer's Disease(AD)、Parkinson's Disease(PD)を自動判別する。
論文 参考訳(メタデータ) (2023-05-26T06:02:31Z) - DA-VEGAN: Differentiably Augmenting VAE-GAN for microstructure
reconstruction from extremely small data sets [110.60233593474796]
DA-VEGANは2つの中心的なイノベーションを持つモデルである。
$beta$-variational autoencoderはハイブリッドGANアーキテクチャに組み込まれている。
このアーキテクチャに特化して、独自の差別化可能なデータ拡張スキームが開発されている。
論文 参考訳(メタデータ) (2023-02-17T08:49:09Z) - EGG-GAE: scalable graph neural networks for tabular data imputation [8.775728170359024]
本稿では,データ計算に欠ける新しいEdGe生成グラフオートエンコーダ(EGG-GAE)を提案する。
EGG-GAEは、入力データのランダムにサンプリングされたミニバッチで動作し、各アーキテクチャ層におけるミニバッチ間の接続性を自動的に推測する。
論文 参考訳(メタデータ) (2022-10-19T10:26:17Z) - Simple and Efficient Heterogeneous Graph Neural Network [55.56564522532328]
不均一グラフニューラルネットワーク(HGNN)は、不均一グラフの豊富な構造的および意味的な情報をノード表現に埋め込む強力な能力を持つ。
既存のHGNNは、同種グラフ上のグラフニューラルネットワーク(GNN)から多くのメカニズム、特に注意機構と多層構造を継承する。
本稿では,これらのメカニズムを詳細に検討し,簡便かつ効率的なヘテロジニアスグラフニューラルネットワーク(SeHGNN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T10:01:46Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Scalable Gaussian Processes for Data-Driven Design using Big Data with
Categorical Factors [14.337297795182181]
ガウス過程(GP)は、大きなデータセット、カテゴリ入力、および複数の応答を調節するのに困難である。
本稿では,変分推論によって得られた潜伏変数と関数を用いて,上記の課題を同時に解決するGPモデルを提案する。
本手法は三元系酸化物材料の機械学習と多スケール対応機構のトポロジー最適化に有用である。
論文 参考訳(メタデータ) (2021-06-26T02:17:23Z) - Multidimensional Scaling for Gene Sequence Data with Autoencoders [0.0]
本稿では、数百万の遺伝子配列を含むデータセットに容易にスケールできるオートエンコーダに基づく次元還元モデルを提案する。
提案モデルは現実世界の菌類遺伝子配列データセットを用いてDAMDSに対して評価される。
論文 参考訳(メタデータ) (2021-04-19T02:14:17Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。