論文の概要: Hierarchically Clustered PCA and CCA via a Convex Clustering Penalty
- arxiv url: http://arxiv.org/abs/2211.16553v1
- Date: Tue, 29 Nov 2022 19:27:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 16:21:19.647115
- Title: Hierarchically Clustered PCA and CCA via a Convex Clustering Penalty
- Title(参考訳): 凸クラスタリングペナルティによる階層的クラスタリングPCAとCAA
- Authors: Amanda M. Buch, Conor Liston, and Logan Grosenick
- Abstract要約: 本稿では, 切り離された特異値分解と凸クラスタリングを組み合わせた教師なし学習手法を提案する。
提案手法は, 従来のクラスタリング手法と, 従来のクラスタリング手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an unsupervised learning approach that combines the truncated
singular value decomposition with convex clustering to estimate within-cluster
directions of maximum variance/covariance (in the variables) while
simultaneously hierarchically clustering (on observations). In contrast to
previous work on joint clustering and embedding, our approach has a
straightforward formulation, is readily scalable via distributed optimization,
and admits a direct interpretation as hierarchically clustered principal
component analysis (PCA) or hierarchically clustered canonical correlation
analysis (CCA). Through numerical experiments and real-world examples relevant
to precision medicine, we show that our approach outperforms traditional and
contemporary clustering methods on underdetermined problems ($p \gg N$ with
tens of observations) and scales to large datasets (e.g., $N=100,000$;
$p=1,000$) while yielding interpretable dendrograms of hierarchical per-cluster
principal components or canonical variates.
- Abstract(参考訳): 本稿では,クラスタ内における最大分散/共分散(変数内)の方向を推定し,(観察上)階層的クラスタリングを同時に行う非教師なし学習手法を提案する。
共同クラスタリングと埋め込みに関する従来の研究とは対照的に,我々の手法は簡単な定式化であり,分散最適化によって容易に拡張可能であり,階層的クラスタ化主成分分析(PCA)や階層的クラスタ化正準相関解析(CCA)として直接解釈できる。
数値実験と実世界の精密医療に関する実例から,本手法は,従来のクラスタリング法と現代のクラスタリング法を比較検討し,大規模データセット(例えば,$N=100,000$; $p=1,000$)にスケールし,階層単位の主成分や正準変数の解釈可能なデンドログラムを出力することを示した。
関連論文リスト
- Hierarchical and Density-based Causal Clustering [6.082022112101251]
本稿では,既成のアルゴリズムを用いて簡易かつ容易に実装可能なプラグイン推定器を提案する。
さらに,それらの収束率について検討し,因果クラスタリングの付加コストが基本的に結果回帰関数の推定誤差であることを示す。
論文 参考訳(メタデータ) (2024-11-02T14:01:04Z) - Federated unsupervised random forest for privacy-preserving patient
stratification [0.4499833362998487]
教師なしランダムフォレストを用いた新しいマルチオミクスクラスタリング手法を提案する。
我々は、機械学習ベンチマークデータセットとThe Cancer Genome Atlasのがんデータに対するアプローチを検証する。
本手法は病気のサブタイプに関して最先端の手法と競合するが,同時にクラスタの解釈可能性も大幅に向上する。
論文 参考訳(メタデータ) (2024-01-29T12:04:14Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Tk-merge: Computationally Efficient Robust Clustering Under General
Assumptions [0.0]
トリミングされたk平均と階層的アグロメレーションに基づく2段階のハイブリッドロバストクラスタリングアルゴリズムを提案する。
また、本手法の自然な一般化と、データ駆動方式で汚染量を推定する適応的な手順を提案する。
論文 参考訳(メタデータ) (2022-01-17T13:05:05Z) - Fast and Interpretable Consensus Clustering via Minipatch Learning [0.0]
IMPACC: Interpretable MiniPatch Adaptive Consensus Clustering を開発した。
我々は、信頼性と計算コストの両面で改善された観測のための適応型サンプリング手法を開発した。
その結果,より正確で解釈可能なクラスタソリューションが得られた。
論文 参考訳(メタデータ) (2021-10-05T22:39:28Z) - Deep Semi-Supervised Embedded Clustering (DSEC) for Stratification of
Heart Failure Patients [50.48904066814385]
本研究では、深層半教師付き組込みクラスタリングを用いて、心不全のデータ駆動型患者サブグループを決定する。
ヘテロジニアスデータから得られた組込み空間から臨床関連クラスタを見出した。
提案アルゴリズムは、異なる結果を持つ患者の新たな未診断サブグループを見つけることができる。
論文 参考訳(メタデータ) (2020-12-24T12:56:46Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。