論文の概要: Subject clustering by IF-PCA and several recent methods
- arxiv url: http://arxiv.org/abs/2306.05363v1
- Date: Thu, 8 Jun 2023 17:07:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 13:17:21.750331
- Title: Subject clustering by IF-PCA and several recent methods
- Title(参考訳): IF-PCAによる対象クラスタリングと最近の方法
- Authors: Dieyi Chen, Jiashun Jin, Zheng Tracy Ke
- Abstract要約: 本稿では,変分自動エンコーダ(VAE)とInfluential Feature(IF-PCA)のアイデアを組み合わせて,対象クラスタリングのための新しい手法としてIF-VAEを提案する。
IF-VAEを解析し、IF-PCA, VAE, Seurat, SC3)の遺伝子マイクロアレイデータセットと8ドルの単細胞RNA-seqデータセットを比較した。
IF-PCAは非常に競争力があり、SeuratやSC3よりわずかに優れています。
- 参考スコア(独自算出の注目度): 3.007949058551534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Subject clustering (i.e., the use of measured features to cluster subjects,
such as patients or cells, into multiple groups) is a problem of great
interest. In recent years, many approaches were proposed, among which
unsupervised deep learning (UDL) has received a great deal of attention. Two
interesting questions are (a) how to combine the strengths of UDL and other
approaches, and (b) how these approaches compare to one other.
We combine Variational Auto-Encoder (VAE), a popular UDL approach, with the
recent idea of Influential Feature PCA (IF-PCA), and propose IF-VAE as a new
method for subject clustering. We study IF-VAE and compare it with several
other methods (including IF-PCA, VAE, Seurat, and SC3) on $10$ gene microarray
data sets and $8$ single-cell RNA-seq data sets. We find that IF-VAE
significantly improves over VAE, but still underperforms IF-PCA. We also find
that IF-PCA is quite competitive, which slightly outperforms Seurat and SC3
over the $8$ single-cell data sets. IF-PCA is conceptually simple and permits
delicate analysis. We demonstrate that IF-PCA is capable of achieving the phase
transition in a Rare/Weak model. Comparatively, Seurat and SC3 are more complex
and theoretically difficult to analyze (for these reasons, their optimality
remains unclear).
- Abstract(参考訳): 対象クラスタリング(患者や細胞などの対象を複数のグループに分類するための計測機能の使用)は大きな関心事である。
近年では、教師なしディープラーニング(unsupervised deep learning:udl)が注目されている多くのアプローチが提案されている。
興味深い2つの質問
(a)udlと他のアプローチの強みを組み合わせる方法、及び
(b)これらのアプローチがどう比較されるか。
Influential Feature PCA (IF-PCA) のアイデアと組み合わせ, 主観的クラスタリングのための新しい手法として IF-VAE を提案する。
IF-VAEを解析し、IF-PCA, VAE, Seurat, SC3)の遺伝子マイクロアレイデータセットと8ドルの単細胞RNA-seqデータセットを比較した。
IF-VAEはVAEよりも有意に改善するが,IF-PCAは依然として低性能である。
また、IF-PCAは非常に競争力があり、シングルセルデータセットの8ドルに対してSeuratとSC3をわずかに上回ります。
IF-PCAは概念的には単純であり、微妙な分析が可能である。
IF-PCAはRare/Weakモデルで相転移を達成可能であることを示す。
対照的に、Seurat と SC3 はより複雑で理論的に解析が難しい(これらの理由から、それらの最適性は不明確である)。
関連論文リスト
- Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data [102.16105233826917]
好みラベルからの学習は、微調整された大きな言語モデルにおいて重要な役割を果たす。
好みの微調整には、教師付き学習、オンライン強化学習(RL)、コントラスト学習など、いくつかの異なるアプローチがある。
論文 参考訳(メタデータ) (2024-04-22T17:20:18Z) - Black-Box $k$-to-$1$-PCA Reductions: Theory and Applications [19.714951004096996]
ブラックボックスデフレ法を$k$-PCAアルゴリズムを設計するためのフレームワークとして分析する。
我々の主な貢献は、$k$-PCAのデフレ法における近似パラメータの劣化に対する、よりシャープな境界である。
我々は,最先端の$k$-PCAアルゴリズムをデータセット汚染に頑健にするために,我々のフレームワークを適用した。
論文 参考訳(メタデータ) (2024-03-06T18:07:20Z) - Efficient fair PCA for fair representation learning [21.990310743597174]
そこで本研究では,標準的なPCAに類似した解析解をカーネル化可能な,概念的にシンプルなアプローチを提案する。
提案手法は,標準PCAやカーネルPCAと同じ複雑さを持ち,半定値プログラミングや多様体最適化に基づく等価PCAの既存手法よりもはるかに高速に動作する。
論文 参考訳(メタデータ) (2023-02-26T13:34:43Z) - Multifidelity Reinforcement Learning with Control Variates [3.2895195535353317]
多くの計算科学や工学の応用において、与えられた入力に対応する興味あるシステムの出力は、異なるコストで異なるレベルの忠実度でクエリすることができる。
本研究では、与えられた制御タスクに対して、異なるレベルの忠実度を持つ複数の環境が存在する場合の強化学習問題について検討する。
状態-作用値関数の推定におけるばらつきを低減するために,低忠実度と高忠実度との相互相関を利用した多忠実度推定器を提案する。
論文 参考訳(メタデータ) (2022-06-10T15:01:37Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - A Simple Information-Based Approach to Unsupervised Domain-Adaptive
Aspect-Based Sentiment Analysis [58.124424775536326]
本稿では,相互情報に基づくシンプルだが効果的な手法を提案し,それらの用語を抽出する。
実験の結果,提案手法はクロスドメインABSAの最先端手法よりも4.32%高い性能を示した。
論文 参考訳(メタデータ) (2022-01-29T10:18:07Z) - Powering Comparative Classification with Sentiment Analysis via Domain
Adaptive Knowledge Transfer [13.98690716279821]
本研究では,ある文中の2つのエンティティ間の嗜好が存在するかどうかを予測することを目的とした比較選好分類(CPC)について検討する。
高品質なCPCモデルは、比較質問応答やレビューベースのレコメンデーションのようなアプリケーションに大きく貢献する。
我々は感情分析によるCPCの精度を向上させる感情分析強化ネットワーク(SAECON)を提案する。
論文 参考訳(メタデータ) (2021-09-07T19:17:12Z) - Federated Deep AUC Maximization for Heterogeneous Data with a Constant
Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。
本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。
FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文 参考訳(メタデータ) (2021-02-09T04:05:19Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Principal Ellipsoid Analysis (PEA): Efficient non-linear dimension
reduction & clustering [9.042239247913642]
本稿では,データとより柔軟なクラスタ形状の非線形関係を実現することにより,PCAとk平均の改善に焦点を当てる。
鍵となる貢献は、PCAに代わる単純で効率的な代替品を定義する、PEA(Principal Analysis)の新しいフレームワークである。
さまざまな実際のデータクラスタリングアプリケーションにおいて、PEAは単純なデータセットのためのk-meansと同様に機能し、より複雑な設定でパフォーマンスを劇的に改善する。
論文 参考訳(メタデータ) (2020-08-17T06:25:50Z) - Multi-label Contrastive Predictive Coding [125.03510235962095]
差分相互情報(MI)推定器は、コントラスト予測符号化(CPC)のような教師なし表現学習法で広く利用されている。
本稿では,複数の正のサンプルを同時に同定する必要がある多ラベル分類問題に基づく新しい推定器を提案する。
同一量の負のサンプルを用いて複数ラベルのCPCが$log m$boundを超えることができる一方で、相互情報の有意な下限であることを示す。
論文 参考訳(メタデータ) (2020-07-20T02:46:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。