論文の概要: Supervised Convex Clustering
- arxiv url: http://arxiv.org/abs/2005.12198v1
- Date: Mon, 25 May 2020 16:12:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 06:24:05.500448
- Title: Supervised Convex Clustering
- Title(参考訳): 教師付き凸クラスタリング
- Authors: Minjie Wang, Tianyi Yao, Genevera I. Allen
- Abstract要約: 我々はSupervised Convex Clustering (SCC) という新しい統計パターン発見手法を提案し,開発する。
SCCは、情報ソースとガイドの両方から、共同凸核融合ペナルティを通じてより解釈可能なパターンを見つけるための強度を借りている。
シミュレーションによるSCCの実用的メリットとアルツハイマー病ゲノム学のケーススタディを示す。
- 参考スコア(独自算出の注目度): 1.4610038284393165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering has long been a popular unsupervised learning approach to identify
groups of similar objects and discover patterns from unlabeled data in many
applications. Yet, coming up with meaningful interpretations of the estimated
clusters has often been challenging precisely due to its unsupervised nature.
Meanwhile, in many real-world scenarios, there are some noisy supervising
auxiliary variables, for instance, subjective diagnostic opinions, that are
related to the observed heterogeneity of the unlabeled data. By leveraging
information from both supervising auxiliary variables and unlabeled data, we
seek to uncover more scientifically interpretable group structures that may be
hidden by completely unsupervised analyses. In this work, we propose and
develop a new statistical pattern discovery method named Supervised Convex
Clustering (SCC) that borrows strength from both information sources and guides
towards finding more interpretable patterns via a joint convex fusion penalty.
We develop several extensions of SCC to integrate different types of
supervising auxiliary variables, to adjust for additional covariates, and to
find biclusters. We demonstrate the practical advantages of SCC through
simulations and a case study on Alzheimer's Disease genomics. Specifically, we
discover new candidate genes as well as new subtypes of Alzheimer's Disease
that can potentially lead to better understanding of the underlying genetic
mechanisms responsible for the observed heterogeneity of cognitive decline in
older adults.
- Abstract(参考訳): クラスタリングは長い間、類似したオブジェクトのグループを特定し、多くのアプリケーションでラベルのないデータからパターンを見つけるための教師なし学習アプローチとして人気を博してきた。
しかし、推定されたクラスターの有意義な解釈を思いつくことは、その教師なしの性質のためにしばしば困難である。
一方,実世界のシナリオの多くでは,非ラベルデータの不均一性に関連する主観的診断的意見など,補助変数を監督するノイズがいくつか存在する。
補助変数とラベルなしデータの両方の情報を活用することで、完全に教師なしの分析によって隠されるかもしれない科学的に解釈可能なグループ構造を明らかにする。
本研究では,情報ソースとガイドの両方から強度を借用したSupervised Convex Clustering (SCC) という新しい統計パターン発見手法を提案し,その手法を開発した。
我々はSCCのいくつかの拡張を開発し、異なる種類の補助変数を統合し、追加の共変量に調整し、双クラスターを見つける。
シミュレーションによりsccの実用的利点を実証し,アルツハイマー病ゲノム学の事例研究を行った。
具体的には、高齢者の認知機能低下を観察する不均一性の原因となる遺伝子機構の理解を深める可能性のある、新しい候補遺伝子およびアルツハイマー病の新たなサブタイプを発見する。
関連論文リスト
- Cluster Quilting: Spectral Clustering for Patchwork Learning [8.500141848121782]
我々は、パッチワーク学習におけるクラスタリングの問題に焦点をあて、何らかの機能に対して共同で観測されない場合であっても、すべてのサンプル間のクラスタを見つけることを目的としている。
本稿では, (i) パッチ間の重なり構造を利用するパッチ順序付け, (ii) パッチワイズSVD, (iii) パッチオーバーラップのためのトップ特異ベクトルの逐次線形マッピング, (iv) 結合および重み付き特異ベクトル上のk-meansからなる新しいスペクトルクラスタリング手法を提案する。
準ガウス混合モデルの下では、両者を反映する非漸近的誤クラスタリング率による理論的保証を確立する。
論文 参考訳(メタデータ) (2024-06-19T20:52:47Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Federated unsupervised random forest for privacy-preserving patient
stratification [0.4499833362998487]
教師なしランダムフォレストを用いた新しいマルチオミクスクラスタリング手法を提案する。
我々は、機械学習ベンチマークデータセットとThe Cancer Genome Atlasのがんデータに対するアプローチを検証する。
本手法は病気のサブタイプに関して最先端の手法と競合するが,同時にクラスタの解釈可能性も大幅に向上する。
論文 参考訳(メタデータ) (2024-01-29T12:04:14Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - GADformer: A Transparent Transformer Model for Group Anomaly Detection on Trajectories [0.9971221656644376]
グループ異常検出(GAD)は、個々のメンバーが異常ではない場合の異常なパターンを特定する。
本稿では,非教師付きおよび半教師付き設定におけるトラジェクトリ上での注意駆動型GADモデルであるGADformerを紹介する。
また,Block-Attention-anomaly-Score (BAS)を導入し,注意パターンを評価することでモデルの透明性を高める。
論文 参考訳(メタデータ) (2023-03-17T08:49:09Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Effect Identification in Cluster Causal Diagrams [51.42809552422494]
クラスタ因果図(略してC-DAG)と呼ばれる新しいタイプのグラフィカルモデルを導入する。
C-DAGは、限定された事前知識に基づいて変数間の関係を部分的に定義することができる。
我々はC-DAGに対する因果推論のための基礎と機械を開発する。
論文 参考訳(メタデータ) (2022-02-22T21:27:31Z) - A Deep Variational Approach to Clustering Survival Data [5.871238645229228]
変分深層クラスタリングにおけるクラスタサバイバルデータに対する新しい確率的アプローチを提案する。
提案手法は,説明変数と潜在的に検閲された生存時間の両方の分布を明らかにするために,深い生成モデルを用いている。
論文 参考訳(メタデータ) (2021-06-10T14:10:25Z) - Algorithm-Agnostic Explainability for Unsupervised Clustering [19.375627480270627]
提案手法は,グローバル置換率変化 (g2pc) 特徴量と局所摂動率変化 (l2pc) 特徴量である。
低次元の地層合成データセット上で, 5つの一般的なクラスタリングアルゴリズムを説明する手法の有用性を示す。
論文 参考訳(メタデータ) (2021-05-17T17:58:55Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。