論文の概要: Disentangling Interpretable Factors with Supervised Independent Subspace Principal Component Analysis
- arxiv url: http://arxiv.org/abs/2410.23595v1
- Date: Thu, 31 Oct 2024 03:09:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 17:02:39.875548
- Title: Disentangling Interpretable Factors with Supervised Independent Subspace Principal Component Analysis
- Title(参考訳): 独立部分空間主成分分析による解離因子の解析
- Authors: Jiayu Su, David A. Knowles, Raul Rabadan,
- Abstract要約: Supervised Independent Subspace principal Component Analysis (texttsisPCA$)は、マルチサブスペース学習用に設計されたPCA拡張である。
乳がん診断などの広範囲な応用を通して,隠れたデータ構造を同定し,分離する能力を示す。
以上の結果から,高次元データ解析における説明可能な表現の重要性を浮き彫りにして,マラリアの定着に伴う機能的経路を明らかにした。
- 参考スコア(独自算出の注目度): 0.9558392439655012
- License:
- Abstract: The success of machine learning models relies heavily on effectively representing high-dimensional data. However, ensuring data representations capture human-understandable concepts remains difficult, often requiring the incorporation of prior knowledge and decomposition of data into multiple subspaces. Traditional linear methods fall short in modeling more than one space, while more expressive deep learning approaches lack interpretability. Here, we introduce Supervised Independent Subspace Principal Component Analysis ($\texttt{sisPCA}$), a PCA extension designed for multi-subspace learning. Leveraging the Hilbert-Schmidt Independence Criterion (HSIC), $\texttt{sisPCA}$ incorporates supervision and simultaneously ensures subspace disentanglement. We demonstrate $\texttt{sisPCA}$'s connections with autoencoders and regularized linear regression and showcase its ability to identify and separate hidden data structures through extensive applications, including breast cancer diagnosis from image features, learning aging-associated DNA methylation changes, and single-cell analysis of malaria infection. Our results reveal distinct functional pathways associated with malaria colonization, underscoring the essentiality of explainable representation in high-dimensional data analysis.
- Abstract(参考訳): 機械学習モデルの成功は、高次元データを効果的に表現することに大きく依存している。
しかし、データ表現が人間の理解できない概念を捉えることは依然として困難であり、しばしば事前知識の取り込みと複数の部分空間へのデータの分解が必要である。
伝統的な線形手法は複数の空間をモデリングするのに不足するが、より表現力のあるディープラーニングアプローチは解釈可能性に欠ける。
本稿では,マルチサブスペース学習用に設計されたPCA拡張であるSupervised Independent Subspace principal Component Analysis(\texttt{sisPCA}$)を紹介する。
Hilbert-Schmidt Independence Criterion (HSIC) を利用すると、$\texttt{sisPCA}$は監督を取り入れ、サブスペースのゆがみを同時に保証する。
画像特徴からの乳がん診断,老化に伴うDNAメチル化変化の学習,マラリア感染の単一細胞解析など,広範囲の応用を通じて,自己エンコーダと正規化線形回帰とのつながりと隠れデータ構造を識別・分離する能力を示した。
以上の結果から,高次元データ解析における説明可能な表現の重要性を浮き彫りにして,マラリアの定着に伴う機能的経路を明らかにした。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Improving Self-supervised Molecular Representation Learning using
Persistent Homology [6.263470141349622]
自己教師付き学習(SSL)は、分子表現学習に大きな可能性を秘めている。
本稿では,複数のスケールにまたがるデータのトポロジ的特徴をモデル化するための数学的ツールである永続ホモロジー(PH)に基づくSSLについて検討する。
論文 参考訳(メタデータ) (2023-11-29T02:58:30Z) - HEALNet: Multimodal Fusion for Heterogeneous Biomedical Data [10.774128925670183]
本稿では,フレキシブルなマルチモーダル融合アーキテクチャであるHybrid Early-fusion Attention Learning Network (HEALNet)を提案する。
The Cancer Genome Atlas (TCGA) の4つのがんデータセットにおける全スライド画像と多モードデータを用いたマルチモーダルサバイバル解析を行った。
HEALNetは、他のエンドツーエンドの訓練された融合モデルと比較して最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-15T17:06:26Z) - Hodge-Aware Contrastive Learning [101.56637264703058]
単純コンプレックスは、マルチウェイ依存によるデータのモデリングに有効である。
我々は、単純なデータを処理するための対照的な自己教師付き学習手法を開発した。
論文 参考訳(メタデータ) (2023-09-14T00:40:07Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Encoding Domain Knowledge in Multi-view Latent Variable Models: A
Bayesian Approach with Structured Sparsity [7.811916700683125]
MuVI はドメインインフォームド・マルチビュー潜在変数モデルのための新しいアプローチである。
私たちのモデルは、機能セットの形でノイズの多いドメインの専門知識を統合することができることを実証しています。
論文 参考訳(メタデータ) (2022-04-13T08:22:31Z) - Joint Characterization of Spatiotemporal Data Manifolds [0.0]
次元減少 (DR) は、高次元信号の「次元の曲線」を緩和するために設計された特徴量の一種である。
近年、非線形DRアルゴリズムが新たに開発され、しばしば「manifold learning」に分類されている。
ここでは、これらの3つのDRアプローチが、ST多様体位相に関する相補的な情報を得ることができることを示す。
論文 参考訳(メタデータ) (2021-08-21T16:42:22Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Towards Robust Partially Supervised Multi-Structure Medical Image
Segmentation on Small-Scale Data [123.03252888189546]
データ不足下における部分教師付き学習(PSL)における方法論的ギャップを埋めるために,不確実性下でのビシナルラベル(VLUU)を提案する。
マルチタスク学習とヴィジナルリスク最小化によって動機づけられたVLUUは、ビジナルラベルを生成することによって、部分的に教師付き問題を完全な教師付き問題に変換する。
本研究は,ラベル効率の高い深層学習における新たな研究の方向性を示唆するものである。
論文 参考訳(メタデータ) (2020-11-28T16:31:00Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。