論文の概要: Multimodal data visualization, denoising and clustering with integrated
diffusion
- arxiv url: http://arxiv.org/abs/2102.06757v1
- Date: Fri, 12 Feb 2021 20:22:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:24:31.116076
- Title: Multimodal data visualization, denoising and clustering with integrated
diffusion
- Title(参考訳): 統合拡散を用いたマルチモーダルデータ可視化・復調・クラスタリング
- Authors: Manik Kuchroo, Abhinav Godavarthi, Guy Wolf, Smita Krishnaswamy
- Abstract要約: マルチモーダルデータセット,あるいは複数の異なる測定値から収集したデータを同一システム上で組み合わせて,共同データ拡散演算子を作成する手法を提案する。
マルチモーダルデータを統合および分析する他の方法よりも優れた性能を発揮し、データ解読、可視化、クラスタリングにおけるこのジョイントオペレータの有用性を示します。
- 参考スコア(独自算出の注目度): 13.873323883842135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method called integrated diffusion for combining multimodal
datasets, or data gathered via several different measurements on the same
system, to create a joint data diffusion operator. As real world data suffers
from both local and global noise, we introduce mechanisms to optimally
calculate a diffusion operator that reflects the combined information from both
modalities. We show the utility of this joint operator in data denoising,
visualization and clustering, performing better than other methods to integrate
and analyze multimodal data. We apply our method to multi-omic data generated
from blood cells, measuring both gene expression and chromatin accessibility.
Our approach better visualizes the geometry of the joint data, captures known
cross-modality associations and identifies known cellular populations. More
generally, integrated diffusion is broadly applicable to multimodal datasets
generated in many medical and biological systems.
- Abstract(参考訳): 本稿では,マルチモーダルデータセット,あるいは同一システム上で複数の異なる測定値を用いて収集されたデータを組み合わせて,共同データ拡散演算子を作成する統合拡散法を提案する。
実世界のデータは局所雑音と大域雑音の両方に悩まされるため,両モードの複合情報を反映した拡散演算子を最適に計算する機構を導入する。
マルチモーダルデータを統合および分析する他の方法よりも優れた性能を発揮し、データ解読、可視化、クラスタリングにおけるこのジョイントオペレータの有用性を示します。
本手法を血液細胞から生成したマルチオムリックデータに適用し,遺伝子発現およびクロマチンアクセシビリティの測定を行った。
本手法は,共同データの幾何学をよりよく可視化し,既知の相互モダリティ関係を捉え,既知の細胞集団を同定する。
より一般に、統合拡散は、多くの医療および生物学的システムで生成されるマルチモーダルデータセットに広く適用できる。
関連論文リスト
- TabDiff: a Mixed-type Diffusion Model for Tabular Data Generation [91.50296404732902]
グラフデータの混合型分布を1つのモデルでモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文 参考訳(メタデータ) (2024-10-27T22:58:47Z) - A Comprehensive Survey on Data Augmentation [55.355273602421384]
データ拡張(Data augmentation)は、既存のデータサンプルを操作することによって高品質な人工データを生成する技術である。
既存の文献調査では、特定のモダリティデータにのみ焦点が当てられている。
本稿では,異なる共通データモダリティのためのデータ拡張技術を含む,より啓蒙的な分類法を提案する。
論文 参考訳(メタデータ) (2024-05-15T11:58:08Z) - Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets with Unbalanced Modalities [9.476402318365446]
本研究では,データサンプルの不均一性だけでなく,機関間のデータモダリティの固有不均一性と不均一性を両立する新しいFLアーキテクチャを提案する。
マルチモーダルFLに適した分散勾配ブレンディングと近接対応クライアント重み付け戦略を考案した。
論文 参考訳(メタデータ) (2024-01-07T23:45:01Z) - CLCLSA: Cross-omics Linked embedding with Contrastive Learning and Self
Attention for multi-omics integration with incomplete multi-omics data [47.2764293508916]
不均一・高次元マルチオミクスデータの統合は、遺伝データの理解においてますます重要になっている。
マルチオミクスデータ統合を行う際に直面する障害のひとつは、機器の感度とコストによる未ペアリングマルチオミクスデータの存在である。
クロスオミクスを用いたマルチオミクス統合のための深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-04-12T00:22:18Z) - MoReL: Multi-omics Relational Learning [26.484803417186384]
ヘテロジニアスビューの分子間相互作用をコードする多部グラフを効率的に推定する新しいディープベイズ生成モデルを提案する。
このようなディープベイズ生成モデルにおける最適輸送正則化により、ビュー固有側情報を組み込むだけでなく、分布ベース正則化によるモデルの柔軟性も向上する。
論文 参考訳(メタデータ) (2022-03-15T02:50:07Z) - A graph representation based on fluid diffusion model for multimodal
data analysis: theoretical aspects and enhanced community detection [14.601444144225875]
流体拡散に基づくグラフ定義の新しいモデルを提案する。
本手法は,マルチモーダルデータ解析において,コミュニティ検出のための最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-12-07T16:30:03Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Double-matched matrix decomposition for multi-view data [0.6091702876917281]
一致したサンプルから異なるソースから収集されたデータである多視点データから,関節信号と個別信号の抽出の問題を考える。
提案する二重整合行列分解は, 被験者間の結合信号と個別信号の同時抽出を可能にする。
本手法をイングランド・プレミアリーグのサッカーの試合のデータに適用し、ドメイン固有の知識に合わせた共同および個別のマルチビュー信号を見つける。
論文 参考訳(メタデータ) (2021-05-07T17:09:57Z) - Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without
Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。
提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文 参考訳(メタデータ) (2020-12-15T20:41:24Z) - Multi-Center Federated Learning [62.57229809407692]
本稿では,フェデレート学習のための新しい多中心集約機構を提案する。
非IIDユーザデータから複数のグローバルモデルを学び、同時にユーザとセンタ間の最適なマッチングを導出する。
ベンチマークデータセットによる実験結果から,本手法はいくつかの一般的なフェデレーション学習法より優れていることが示された。
論文 参考訳(メタデータ) (2020-05-03T09:14:31Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。