論文の概要: Conjoined Dirichlet Process
- arxiv url: http://arxiv.org/abs/2002.03223v1
- Date: Sat, 8 Feb 2020 19:41:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 22:37:22.579493
- Title: Conjoined Dirichlet Process
- Title(参考訳): 接合ディリクレプロセス
- Authors: Michelle N. Ngo, Dustin S. Pluta, Alexander N. Ngo, Babak Shahbaba
- Abstract要約: 我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
- 参考スコア(独自算出の注目度): 63.89763375457853
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biclustering is a class of techniques that simultaneously clusters the rows
and columns of a matrix to sort heterogeneous data into homogeneous blocks.
Although many algorithms have been proposed to find biclusters, existing
methods suffer from the pre-specification of the number of biclusters or place
constraints on the model structure. To address these issues, we develop a
novel, non-parametric probabilistic biclustering method based on Dirichlet
processes to identify biclusters with strong co-occurrence in both rows and
columns. The proposed method utilizes dual Dirichlet process mixture models to
learn row and column clusters, with the number of resulting clusters determined
by the data rather than pre-specified. Probabilistic biclusters are identified
by modeling the mutual dependence between the row and column clusters. We apply
our method to two different applications, text mining and gene expression
analysis, and demonstrate that our method improves bicluster extraction in many
settings compared to existing approaches.
- Abstract(参考訳): ビクラスタリング(Biclustering)は、行列の行と列を同時にクラスタリングして、異種データを均質なブロックに分類するテクニックのクラスである。
多くのアルゴリズムがビクラスタを見つけるために提案されているが、既存の手法はビクラスタ数の事前特定やモデル構造上の制約に悩まされている。
これらの問題に対処するため、我々はDirichletプロセスに基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、行と列の両方に強い共起を持つビクラスタを同定する。
提案手法では,2つのディリクレプロセス混合モデルを用いて行と列のクラスタを学習する。
確率的ビクラスタは、行と列クラスタ間の相互依存をモデル化することによって同定される。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
関連論文リスト
- HBIC: A Biclustering Algorithm for Heterogeneous Datasets [0.0]
Biclusteringは、データマトリックス内で行と列を同時にクラスタすることを目的とした、教師なしの機械学習アプローチである。
複素異種データから有意義なビクラスタを発見することが可能な,HBICと呼ばれるビクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-23T16:48:10Z) - Goodness-of-fit Test on the Number of Biclusters in Relational Data
Matrix [41.60125423028092]
Biclusteringは与えられた観察されたマトリックスの均質なサブマトリックスを検出する問題です。
本稿では,正規格子仮定を必要としない2クラスタ数に関する新しい統計テストを提案する。
論文 参考訳(メタデータ) (2021-02-23T12:25:58Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Biclustering with Alternating K-Means [5.089110111757978]
本稿では,経験的クラスタリングリスクを最小限に抑えるというアイデアに基づいて,ビクラスタリング問題の新たな定式化について述べる。
カラムと行間のk-meansクラスタリングアルゴリズムの適応バージョンを交互に使用することにより,局所最小値を求める,単純で斬新なアルゴリズムを提案する。
その結果,本アルゴリズムは,データ中の有意義な構造を検知し,様々な設定や状況において競合する2クラスタリング手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-09-09T20:15:24Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。