論文の概要: Learning complex dependency structure of gene regulatory networks from
high dimensional micro-array data with Gaussian Bayesian networks
- arxiv url: http://arxiv.org/abs/2106.15365v1
- Date: Mon, 28 Jun 2021 15:04:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 09:40:52.117944
- Title: Learning complex dependency structure of gene regulatory networks from
high dimensional micro-array data with Gaussian Bayesian networks
- Title(参考訳): ガウスベイズネットワークを用いた高次元マイクロアレイデータから遺伝子制御ネットワークの複雑な依存性構造を学ぶ
- Authors: Catharina Elisabeth Graafland and Jos\'e Manuel Guti\'errez
- Abstract要約: 遺伝子発現データセットは、比較的小さなサンプルサイズを持つ数千の遺伝子から構成される。
Glassoアルゴリズムは高次元マイクロアレイデータセットを扱うために提案されている。
既定のGlassoアルゴリズムの修正は、複雑な相互作用構造の問題を克服するために開発されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gene expression datasets consist of thousand of genes with relatively small
samplesizes (i.e. are large-$p$-small-$n$). Moreover, dependencies of various
orders co-exist in the datasets. In the Undirected probabilistic Graphical
Model (UGM) framework the Glasso algorithm has been proposed to deal with high
dimensional micro-array datasets forcing sparsity. Also, modifications of the
default Glasso algorithm are developed to overcome the problem of complex
interaction structure. In this work we advocate the use of a simple score-based
Hill Climbing algorithm (HC) that learns Gaussian Bayesian Networks (BNs)
leaning on Directed Acyclic Graphs (DAGs). We compare HC with Glasso and its
modifications in the UGM framework on their capability to reconstruct GRNs from
micro-array data belonging to the Escherichia Coli genome. We benefit from the
analytical properties of the Joint Probability Density (JPD) function on which
both directed and undirected PGMs build to convert DAGs to UGMs.
We conclude that dependencies in complex data are learned best by the HC
algorithm, presenting them most accurately and efficiently, simultaneously
modelling strong local and weaker but significant global connections coexisting
in the gene expression dataset. The HC algorithm adapts intrinsically to the
complex dependency structure of the dataset, without forcing a specific
structure in advance. On the contrary, Glasso and modifications model
unnecessary dependencies at the expense of the probabilistic information in the
network and of a structural bias in the JPD function that can only be relieved
including many parameters.
- Abstract(参考訳): 遺伝子発現データセットは、比較的少ないサンプル(すなわち)を持つ数千の遺伝子からなる。
large-$p$-small-$n$である。
さらに、データセットに様々な順序の依存関係が共存する。
In the Undirected probabilistic Graphical Model (UGM) framework, the Glasso algorithm has proposed to handle with high dimensional micro-array datasets forced sparsity。
また、複雑な相互作用構造の問題を克服するために、デフォルトのglassoアルゴリズムの修正も開発されている。
本研究では,DAG(Directed Acyclic Graphs)に頼ったガウスベイズネットワーク(BN)を学習する単純なスコアベースヒルクライミングアルゴリズム(HC)の使用を提唱する。
HCとGlassoを比較し,その改良点として,大腸菌ゲノムのマイクロアレイデータからGRNを再構成する能力について検討した。
我々は、DAGをUGMに変換するために、指向性PGMと非指向性PGMの両方が構築されるジョイント確率密度(JPD)関数の解析的性質の恩恵を受ける。
複雑なデータの依存関係はhcアルゴリズムによって最も良く学習され、最も正確かつ効率的に提示され、遺伝子発現データセットに共存する強い局所的および弱いが重要なグローバル接続を同時にモデル化する。
HCアルゴリズムは、特定の構造を事前に強制することなく、データセットの複雑な依存構造に本質的に適応する。
それとは対照的に、glassoとmodifiedsモデルは、ネットワーク内の確率的情報と多くのパラメータを含むだけで緩和できるjpd関数の構造的バイアスを犠牲にして不要な依存関係をモデル化する。
関連論文リスト
- Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Coordinated Multi-Neighborhood Learning on a Directed Acyclic Graph [6.727984016678534]
因果非巡回グラフ(DAG)の構造を学習することは、機械学習や人工知能の多くの分野で有用である。
強い、しばしば制限的な仮定なしに優れた経験的、理論的結果を得ることは困難である。
本論文では,複数のユーザ特定ターゲットノードの周囲の局所構造を推定する制約に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T08:49:43Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Higher Order Gauge Equivariant CNNs on Riemannian Manifolds and
Applications [7.322121417864824]
我々はゲージ同変畳み込み(GEVNet)と呼ばれるゲージ同変畳み込みの高次一般化を導入する。
これにより、空間的に拡張された非線形相互作用を、大域的等距離と等値性を維持しながら、与えられた場内でモデル化することができる。
神経画像データ実験では、結果として生じる2部構造を用いて、拡散磁気共鳴画像(dMRI)からLewy Body Disease(DLB)、Alzheimer's Disease(AD)、Parkinson's Disease(PD)を自動判別する。
論文 参考訳(メタデータ) (2023-05-26T06:02:31Z) - Simple and Efficient Heterogeneous Graph Neural Network [55.56564522532328]
不均一グラフニューラルネットワーク(HGNN)は、不均一グラフの豊富な構造的および意味的な情報をノード表現に埋め込む強力な能力を持つ。
既存のHGNNは、同種グラフ上のグラフニューラルネットワーク(GNN)から多くのメカニズム、特に注意機構と多層構造を継承する。
本稿では,これらのメカニズムを詳細に検討し,簡便かつ効率的なヘテロジニアスグラフニューラルネットワーク(SeHGNN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T10:01:46Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - GenURL: A General Framework for Unsupervised Representation Learning [58.59752389815001]
教師なし表現学習(URL)は、教師なしの高次元データのコンパクトな埋め込みを学習する。
本稿では,様々なURLタスクにスムーズに適応可能な類似性ベースの統合URLフレームワークGenURLを提案する。
実験により、GenURLは、自己教師付き視覚学習、無教師付き知識蒸留(KD)、グラフ埋め込み(GE)、次元縮小において、一貫した最先端性能を達成することが示された。
論文 参考訳(メタデータ) (2021-10-27T16:24:39Z) - Scalable Gaussian Processes for Data-Driven Design using Big Data with
Categorical Factors [14.337297795182181]
ガウス過程(GP)は、大きなデータセット、カテゴリ入力、および複数の応答を調節するのに困難である。
本稿では,変分推論によって得られた潜伏変数と関数を用いて,上記の課題を同時に解決するGPモデルを提案する。
本手法は三元系酸化物材料の機械学習と多スケール対応機構のトポロジー最適化に有用である。
論文 参考訳(メタデータ) (2021-06-26T02:17:23Z) - Multidimensional Scaling for Gene Sequence Data with Autoencoders [0.0]
本稿では、数百万の遺伝子配列を含むデータセットに容易にスケールできるオートエンコーダに基づく次元還元モデルを提案する。
提案モデルは現実世界の菌類遺伝子配列データセットを用いてDAMDSに対して評価される。
論文 参考訳(メタデータ) (2021-04-19T02:14:17Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。