論文の概要: DiSC: Differential Spectral Clustering of Features
- arxiv url: http://arxiv.org/abs/2211.05314v1
- Date: Thu, 10 Nov 2022 03:32:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:28:00.799156
- Title: DiSC: Differential Spectral Clustering of Features
- Title(参考訳): DiSC: 特徴の差分スペクトルクラスタリング
- Authors: Ram Dyuthi Sristi, Gal Mishne, Ariel Jaffe
- Abstract要約: 条件を区別する特徴群を検出するためのデータ駆動型手法を開発した。
条件固有の特徴グラフ間で接続性が大きく異なるノードのサブセットを計算する。
- 参考スコア(独自算出の注目度): 7.111650988432555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Selecting subsets of features that differentiate between two conditions is a
key task in a broad range of scientific domains. In many applications, the
features of interest form clusters with similar effects on the data at hand. To
recover such clusters we develop DiSC, a data-driven approach for detecting
groups of features that differentiate between conditions. For each condition,
we construct a graph whose nodes correspond to the features and whose weights
are functions of the similarity between them for that condition. We then apply
a spectral approach to compute subsets of nodes whose connectivity differs
significantly between the condition-specific feature graphs. On the theoretical
front, we analyze our approach with a toy example based on the stochastic block
model. We evaluate DiSC on a variety of datasets, including MNIST,
hyperspectral imaging, simulated scRNA-seq and task fMRI, and demonstrate that
DiSC uncovers features that better differentiate between conditions compared to
competing methods.
- Abstract(参考訳): 2つの条件を区別する特徴のサブセットを選択することは、幅広い科学領域において重要な課題である。
多くのアプリケーションにおいて、興味ある特徴はデータに類似した影響を持つクラスタを形成する。
このようなクラスタを回復するために、条件を区別する特徴群を検出するデータ駆動型アプローチであるDiSCを開発した。
各条件について、ノードが特徴に対応し、重みがその条件に対するノード間の類似性の関数であるグラフを構築する。
次に、条件特異的特徴グラフと接続性が著しく異なるノードのサブセットを計算するためにスペクトルアプローチを適用する。
理論的には、確率ブロックモデルに基づくおもちゃの例を用いて、我々のアプローチを分析する。
我々は、MNIST、ハイパースペクトルイメージング、シミュレートされたscRNA-seq、タスクfMRIなど、様々なデータセット上でDiSCを評価し、DiSCが競合する手法と比較して、条件をよりよく区別する特徴を明らかにすることを実証した。
関連論文リスト
- Supervised Pattern Recognition Involving Skewed Feature Densities [49.48516314472825]
一致する類似度指数に基づくユークリッド距離の分類ポテンシャルと相似性指数を比較する。
隣接する2つの群の密度間の交点を分類する精度を考慮する。
論文 参考訳(メタデータ) (2024-09-02T12:45:18Z) - Graph Clustering with Cross-View Feature Propagation [0.48065059125122356]
グラフデータにおけるクラスタ識別を強化するために,多視点特徴伝搬を利用した新しい手法であるGCFP(Graph Clustering with Cross-View Feature Propagation)を提案する。
実世界のグラフを用いた実験により,GCCFPのクラスタリング性能は確立された手法に比べて優れていた。
論文 参考訳(メタデータ) (2024-08-12T09:38:15Z) - Semi-Supervised Clustering via Structural Entropy with Different
Constraints [30.215985625884922]
本稿では,多種多様な制約を組み込んで,分割と階層クラスタリングを両立させる手法であるStructure Entropy (SSE) による半教師付きクラスタリングを提案する。
9つのクラスタリングデータセット上でSSEを評価し,それを11の半教師付きパーティショニングおよび階層クラスタリング手法と比較した。
論文 参考訳(メタデータ) (2023-12-18T04:00:40Z) - Histopathology Whole Slide Image Analysis with Heterogeneous Graph
Representation Learning [78.49090351193269]
本稿では,WSI分析のために,異なる種類の核間の相互関係を利用する新しいグラフベースのフレームワークを提案する。
具体的には、WSI を各ノードに "nucleus-type" 属性と各エッジに類似した意味属性を持つ異種グラフとして定式化する。
我々のフレームワークは、様々なタスクに対してかなりのマージンで最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-07-09T14:43:40Z) - Comparison of Clustering Algorithms for Statistical Features of
Vibration Data Sets [0.4806505912512235]
振動データセットの時間と周波数領域から抽出した統計的特徴に対して,クラスタリングアルゴリズムK平均クラスタリング,OPTICS,およびガウス混合モデルクラスタリング(GMM)を広範囲に比較した。
本研究は, 平均的特徴(平均, 中間値), 分散的特徴(標準偏差, 原子間距離)が, 形状的特徴(骨格性, クルトーシス)よりも有意に優れていたことを示した。
クラスタ数の増加に伴い、クラスタリングアルゴリズムは、いくつかの特定のアルゴリズム制限があるにも関わらず、パフォーマンスが向上した。
論文 参考訳(メタデータ) (2023-05-11T12:19:30Z) - Perfect Spectral Clustering with Discrete Covariates [68.8204255655161]
本稿では,大規模なスパースネットワークのクラスにおいて,高い確率で完全クラスタリングを実現するスペクトルアルゴリズムを提案する。
本手法は,スペクトルクラスタリングによる一貫した潜在構造回復を保証する最初の方法である。
論文 参考訳(メタデータ) (2022-05-17T01:41:06Z) - The role of feature space in atomistic learning [62.997667081978825]
物理的にインスパイアされた記述子は、原子論シミュレーションへの機械学習技術の応用において重要な役割を果たしている。
異なる記述子のセットを比較するためのフレームワークを導入し、メトリクスとカーネルを使ってそれらを変換するさまざまな方法を紹介します。
原子密度のn-体相関から構築した表現を比較し,低次特徴の利用に伴う情報損失を定量的に評価した。
論文 参考訳(メタデータ) (2020-09-06T14:12:09Z) - Interpretable Visualizations with Differentiating Embedding Networks [0.0]
本稿では,新たな非教師付きシームズニューラルネットワークトレーニングシステムと損失関数に基づく,微分埋め込みネットワーク(DEN)を用いた可視化アルゴリズムを提案する。
Siameseのニューラルネットワークは、データセット内の特定のサンプルペア間の差別化や類似した特徴を見つけ、これらの特徴を使用して、データセットを視覚化可能な低次元空間に埋め込む。
DENを解釈するために、可視化の上にエンドツーエンドのパラメトリッククラスタリングアルゴリズムを作成し、次にSHAPスコアを利用して、サンプル空間のどの特徴が重要かを決定する。
論文 参考訳(メタデータ) (2020-06-11T17:30:44Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z) - Stable and consistent density-based clustering via multiparameter
persistence [77.34726150561087]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。