論文の概要: Multiscale methods for signal selection in single-cell data
- arxiv url: http://arxiv.org/abs/2206.07760v1
- Date: Wed, 15 Jun 2022 18:42:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-18 21:15:32.868907
- Title: Multiscale methods for signal selection in single-cell data
- Title(参考訳): 単一セルデータにおける信号選択のためのマルチスケール手法
- Authors: Renee S. Hoekzema, Lewis Marsh, Otto Sumray, Xin Lu, Helen M. Byrne,
Heather A. Harrington
- Abstract要約: 教師なし特徴選択のための3つのトポロジカルな数学的手法を提案する。
単細胞転写学データセットにこれらの手法を適用することで,これらの手法の有用性を実証する。
- 参考スコア(独自算出の注目度): 2.683475550237718
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Analysis of single-cell transcriptomics often relies on clustering cells and
then performing differential gene expression (DGE) to identify genes that vary
between these clusters. These discrete analyses successfully determine cell
types and markers; however, continuous variation within and between cell types
may not be detected. We propose three topologically-motivated mathematical
methods for unsupervised feature selection that consider discrete and
continuous transcriptional patterns on an equal footing across multiple scales
simultaneously. Eigenscores ($\mathrm{eig}_i$) rank signals or genes based on
their correspondence to low-frequency intrinsic patterning in the data using
the spectral decomposition of the graph Laplacian. The multiscale Laplacian
score (MLS) is an unsupervised method for locating relevant scales in data and
selecting the genes that are coherently expressed at these respective scales.
The persistent Rayleigh quotient (PRQ) takes data equipped with a filtration,
allowing separation of genes with different roles in a bifurcation process
(e.g. pseudo-time). We demonstrate the utility of these techniques by applying
them to published single-cell transcriptomics data sets. The methods validate
previously identified genes and detect additional genes with coherent
expression patterns. By studying the interaction between gene signals and the
geometry of the underlying space, the three methods give multidimensional
rankings of the genes and visualisation of relationships between them.
- Abstract(参考訳): 単細胞転写産物の解析は、しばしばクラスタリング細胞に依存し、これらのクラスター間で異なる遺伝子を同定するために微分遺伝子発現(dge)を行う。
これらの離散分析は細胞タイプとマーカーを適切に決定するが、細胞タイプ間の連続的な変異は検出されない。
本研究では,複数スケールの足場における離散的かつ連続的な転写パターンを同時に考慮した,教師なし特徴選択のための3つの位相的動機付け数学的手法を提案する。
固有スコア (\mathrm{eig}_i$) は、グラフラプラシアンのスペクトル分解を用いて、データの低周波内在的パターニングに対応する信号や遺伝子をランク付けする。
マルチスケールラプラシアスコア(MLS)は、データ中の関連するスケールを探索し、これらのスケールで整合的に発現する遺伝子を選択する教師なしの方法である。
持続的レイリー商(PRQ)は、フィルターを備えたデータを取り、分岐過程(例えば擬時間)において異なる役割を持つ遺伝子の分離を可能にする。
本稿では,これらの手法を単細胞トランスクリプトミクスデータセットに適用し,その有用性を示す。
この方法は、以前に同定された遺伝子を検証し、コヒーレントな発現パターンを持つ追加の遺伝子を検出する。
遺伝子シグナルと基底空間の幾何学の相互作用を研究することで、3つの手法は遺伝子の多次元的なランク付けとそれらの間の関係の可視化を与える。
関連論文リスト
- Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - MuSe-GNN: Learning Unified Gene Representation From Multimodal
Biological Graph Data [22.938437500266847]
マルチモーダル類似性学習グラフニューラルネットワークという新しいモデルを提案する。
マルチモーダル機械学習とディープグラフニューラルネットワークを組み合わせて、単一セルシークエンシングと空間転写データから遺伝子発現を学習する。
本モデルでは, 遺伝子機能, 組織機能, 疾患, 種進化の解析のために, 統合された遺伝子表現を効率よく生成する。
論文 参考訳(メタデータ) (2023-09-29T13:33:53Z) - Genetic heterogeneity analysis using genetic algorithm and network
science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文 参考訳(メタデータ) (2023-08-12T01:28:26Z) - Conditionally Invariant Representation Learning for Disentangling
Cellular Heterogeneity [25.488181126364186]
本稿では,不必要な変数や乱れに条件付き不変な表現を学習するために,ドメインの可変性を活用する新しい手法を提案する。
単細胞ゲノム学におけるデータ統合など,生物の課題に対して本手法を適用した。
具体的には、提案手法は、対象のタスクと無関係なデータバイアスや興味の因果的説明から生物学的信号を解き放つのに役立つ。
論文 参考訳(メタデータ) (2023-07-02T12:52:41Z) - Graph Fourier MMD for Signals on Graphs [67.68356461123219]
本稿では,グラフ上の分布と信号の間の新しい距離を提案する。
GFMMDは、グラフ上で滑らかであり、期待差を最大化する最適な目撃関数によって定義される。
グラフベンチマークのデータセットと単一セルRNAシークエンシングデータ解析について紹介する。
論文 参考訳(メタデータ) (2023-06-05T00:01:17Z) - Using Signal Processing in Tandem With Adapted Mixture Models for
Classifying Genomic Signals [16.119729980200955]
本稿では,ガウス混合モデルとタンデムの信号処理を併用して,シーケンスのスペクトル表現を改善する手法を提案する。
提案手法は、確立されたベンチマークデータセットに対して、6.06%の精度で類似した最先端の手法より優れている。
論文 参考訳(メタデータ) (2022-11-03T06:10:55Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - Self-Supervised Graph Representation Learning for Neuronal Morphologies [75.38832711445421]
ラベルのないデータセットから3次元神経形態の低次元表現を学習するためのデータ駆動型アプローチであるGraphDINOを提案する。
2つの異なる種と複数の脳領域において、この方法では、専門家による手動の特徴に基づく分類と同程度に形態学的細胞型クラスタリングが得られることを示す。
提案手法は,大規模データセットにおける新しい形態的特徴や細胞型の発見を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - High-dimensional multi-trait GWAS by reverse prediction of genotypes [3.441021278275805]
逆回帰は、高次元設定でマルチトレイGWASを実行するための有望なアプローチである。
マルチトランジットGWASにおける逆回帰のための異なる機械学習手法を解析した。
モデル特徴係数は変異体と個々の形質の関連性の強さと相関し,真のトランス-eQTL標的遺伝子を予測した。
論文 参考訳(メタデータ) (2021-10-29T22:34:35Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。