論文の概要: The Gene Mover's Distance: Single-cell similarity via Optimal Transport
- arxiv url: http://arxiv.org/abs/2102.01218v1
- Date: Mon, 1 Feb 2021 22:45:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 09:51:31.092299
- Title: The Gene Mover's Distance: Single-cell similarity via Optimal Transport
- Title(参考訳): Gene Mover's Distance:Optimal Transportによる単一細胞類似性
- Authors: Riccardo Bellazzi and Andrea Codegoni and Stefano Gualandi and
Giovanna Nicora and Eleonora Vercesi
- Abstract要約: 本稿では、遺伝子発現プロファイルに基づく一対の細胞間の類似性の尺度であるGene Mover's Distanceを紹介する。
細胞の状態に応じた分類とタイプによる分類という,2つの分類問題の解決に活用する。
- 参考スコア(独自算出の注目度): 1.4662764942689914
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces the Gene Mover's Distance, a measure of similarity
between a pair of cells based on their gene expression profiles obtained via
single-cell RNA sequencing. The underlying idea of the proposed distance is to
interpret the gene expression array of a single cell as a discrete probability
measure. The distance between two cells is hence computed by solving an Optimal
Transport problem between the two corresponding discrete measures. In the
Optimal Transport model, we use two types of cost function for measuring the
distance between a pair of genes. The first cost function exploits a gene
embedding, called gene2vec, which is used to map each gene to a high
dimensional vector: the cost of moving a unit of mass of gene expression from a
gene to another is set to the Euclidean distance between the corresponding
embedded vectors. The second cost function is based on a Pearson distance among
pairs of genes. In both cost functions, the more two genes are correlated, the
lower is their distance. We exploit the Gene Mover's Distance to solve two
classification problems: the classification of cells according to their
condition and according to their type. To assess the impact of our new metric,
we compare the performances of a $k$-Nearest Neighbor classifier using
different distances. The computational results show that the Gene Mover's
Distance is competitive with the state-of-the-art distances used in the
literature.
- Abstract(参考訳): 本稿では, 単細胞RNAシークエンシングにより得られた遺伝子発現プロファイルに基づいて, 一対の細胞間の類似性の尺度であるGene Mover's Distanceを紹介する。
提案する距離の基本的な考え方は、単一細胞の遺伝子発現配列を離散的確率測度として解釈することである。
したがって、2つのセル間の距離は、対応する2つの離散測度間の最適輸送問題を解くことで計算される。
最適輸送モデルでは、一対の遺伝子間の距離を測定するために2種類のコスト関数を用いる。
最初のコスト関数は、遺伝子を高次元ベクターにマッピングするために使用されるgen2vecと呼ばれる遺伝子埋め込みを利用する:遺伝子から他のベクターへ遺伝子発現の質量の単位を移動させるコストは、対応する埋め込みベクター間のユークリッド距離に設定される。
第2のコスト関数はペアの遺伝子間のピアソン距離に基づいている。
両方のコスト関数では、2つの遺伝子が相関するほど、その距離は低くなります。
我々は、遺伝子ムーバーの距離を利用して、その状態とタイプに応じて細胞を分類する2つの分類問題を解く。
新しいメトリックの影響を評価するために、異なる距離を使用して$ k$-Nearest Neighbor分類器のパフォーマンスを比較します。
計算結果から、遺伝子ムーバーの距離は、文献で使われている最先端距離と競合していることが示された。
関連論文リスト
- Robust Multi-view Co-expression Network Inference [8.697303234009528]
トランスクリプトームデータから遺伝子共発現ネットワークを推定することは、多くの課題をもたらす。
複数の独立研究から高次元グラフ推論のためのロバストな手法を提案する。
論文 参考訳(メタデータ) (2024-09-30T06:30:09Z) - Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Optimal transport distances for directed, weighted graphs: a case study with cell-cell communication networks [5.079602839359521]
最適輸送の変種に基づく有向グラフを比較するための2つの距離測度を提案する。
これら2つの距離を評価し、シミュレーショングラフデータと実世界指向セル通信グラフの両方に対して、それらの相対的性能について考察する。
論文 参考訳(メタデータ) (2023-09-13T15:36:39Z) - Graph Fourier MMD for Signals on Graphs [67.68356461123219]
本稿では,グラフ上の分布と信号の間の新しい距離を提案する。
GFMMDは、グラフ上で滑らかであり、期待差を最大化する最適な目撃関数によって定義される。
グラフベンチマークのデータセットと単一セルRNAシークエンシングデータ解析について紹介する。
論文 参考訳(メタデータ) (2023-06-05T00:01:17Z) - Geodesic Sinkhorn for Fast and Accurate Optimal Transport on Manifolds [53.110934987571355]
多様体グラフ上の熱核に基づく測地学的シンクホーンを提案する。
化学療法中の患者試料からの高次元単細胞データの複数分布のバリセンタの計算に本法を適用した。
論文 参考訳(メタデータ) (2022-11-02T00:51:35Z) - Spatial Transcriptomics Dimensionality Reduction using Wavelet Bases [0.76146285961466]
空間構造を保持する遺伝子発現次元減少アルゴリズムを提案する。
ウェーブレット変換と行列分解を組み合わせ、空間的に変化する遺伝子を選択する。
グローバル空間パターンをキャプチャする抽出された表現遺伝子を可視化する。
論文 参考訳(メタデータ) (2022-05-19T04:13:51Z) - Gene Function Prediction with Gene Interaction Networks: A Context Graph
Kernel Approach [24.234645183601998]
そこで本研究では,焦点遺伝子に関連付けられた遺伝子相互作用ネットワークとして,遺伝子コンテキストグラフを用いた機能推定を提案する。
カーネルベースの機械学習フレームワークでは、コンテキストグラフで情報をキャプチャするコンテキストグラフカーネルを設計する。
論文 参考訳(メタデータ) (2022-04-22T02:54:01Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Rethink Maximum Mean Discrepancy for Domain Adaptation [77.2560592127872]
本論文は,(1)最大平均距離の最小化は,それぞれソースとクラス内距離の最大化に等しいが,その差を暗黙の重みと共同で最小化し,特徴判別性は低下する,という2つの本質的な事実を理論的に証明する。
いくつかのベンチマークデータセットの実験は、理論的な結果の有効性を証明しただけでなく、我々のアプローチが比較した最先端手法よりも大幅に向上できることを実証した。
論文 参考訳(メタデータ) (2020-07-01T18:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。