論文の概要: Goodness-of-fit Test on the Number of Biclusters in Relational Data
Matrix
- arxiv url: http://arxiv.org/abs/2102.11658v1
- Date: Tue, 23 Feb 2021 12:25:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-24 14:04:39.539489
- Title: Goodness-of-fit Test on the Number of Biclusters in Relational Data
Matrix
- Title(参考訳): リレーショナルデータマトリックスにおける双子数に対する適合性試験
- Authors: Chihiro Watanabe, Taiji Suzuki
- Abstract要約: Biclusteringは与えられた観察されたマトリックスの均質なサブマトリックスを検出する問題です。
本稿では,正規格子仮定を必要としない2クラスタ数に関する新しい統計テストを提案する。
- 参考スコア(独自算出の注目度): 41.60125423028092
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biclustering is a problem to detect homogeneous submatrices in a given
observed matrix, and it has been shown to be an effective tool for relational
data analysis. Although there have been many studies for estimating the
underlying bicluster structure of a matrix, few have enabled us to determine
the appropriate number of biclusters in an observed matrix. Recently, a
statistical test on the number of biclusters has been proposed for a
regular-grid bicluster structure, where we assume that the latent bicluster
structure can be represented by row-column clustering. However, when the latent
bicluster structure does not satisfy such regular-grid assumption, the previous
test requires too many biclusters (i.e., finer bicluster structure) for the
null hypothesis to be accepted, which is not desirable in terms of interpreting
the accepted bicluster structure. In this paper, we propose a new statistical
test on the number of biclusters that does not require the regular-grid
assumption, and derive the asymptotic behavior of the proposed test statistic
in both null and alternative cases. To develop the proposed test, we construct
a consistent submatrix localization algorithm, that is, the probability that it
outputs the correct bicluster structure converges to one. We show the
effectiveness of the proposed method by applying it to both synthetic and
practical relational data matrices.
- Abstract(参考訳): Biclusteringは与えられた観察されたマトリックスの均質なサブマトリックスを検出する問題であり、リレーショナルデータ分析の効果的なツールであることが示されています。
行列の基盤となる二クラスター構造を推定するための多くの研究があるが、観測された行列の適切な数の二クラスターを決定できるものは少ない。
近年,正規グリッド型バイクラスタ構造において,遅延型バイクラスタ構造を行列クラスタリングで表現できると仮定した,バイクラスタ数に関する統計的テストが提案されている。
しかし、潜在二クラスター構造がそのような正規格子の仮定を満たしていない場合、以前のテストでは、ヌル仮説が受け入れられるにはあまりにも多くの二クラスター(すなわち、より細かい二クラスター構造)が必要である。
本稿では,正規格子の仮定を必要としないビクラスタ数に関する新しい統計テストを提案し,ヌルおよびオルタナティブのいずれにおいても,提案した検定統計量の漸近的挙動を導出する。
提案手法を考案するために, 一貫性のある部分行列局在化アルゴリズム, すなわち, 正しい二クラスター構造を出力する確率を 1 に収束させる。
本手法を合成および実用的な関係データ行列に適用することにより,提案手法の有効性を示す。
関連論文リスト
- HBIC: A Biclustering Algorithm for Heterogeneous Datasets [0.0]
Biclusteringは、データマトリックス内で行と列を同時にクラスタすることを目的とした、教師なしの機械学習アプローチである。
複素異種データから有意義なビクラスタを発見することが可能な,HBICと呼ばれるビクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-23T16:48:10Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Biclustering with Alternating K-Means [5.089110111757978]
本稿では,経験的クラスタリングリスクを最小限に抑えるというアイデアに基づいて,ビクラスタリング問題の新たな定式化について述べる。
カラムと行間のk-meansクラスタリングアルゴリズムの適応バージョンを交互に使用することにより,局所最小値を求める,単純で斬新なアルゴリズムを提案する。
その結果,本アルゴリズムは,データ中の有意義な構造を検知し,様々な設定や状況において競合する2クラスタリング手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-09-09T20:15:24Z) - Selective Inference for Latent Block Models [50.83356836818667]
本研究では,潜在ブロックモデルに対する選択的推論法を提案する。
我々は,潜在ブロックモデルの行と列クラスタのメンバシップの集合に対する統計的テストを構築した。
提案された正確で近似されたテストは、選択バイアスを考慮していない単純なテストと比較して効果的に機能する。
論文 参考訳(メタデータ) (2020-05-27T10:44:19Z) - Bi-objective Optimization of Biclustering with Binary Data [0.0]
クラスタリングは、いくつかの類似性基準に従って、データオブジェクトをクラスタと呼ばれるサブセットに分割する。
本稿では,クラスタの重複を許容する準クラスタリングについて論じる。
ビクラスタリングは、オブジェクトとフィーチャーを同時にグループ化し、特定のオブジェクトのグループに特別な機能のグループがあるようにします。
論文 参考訳(メタデータ) (2020-02-09T21:49:26Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。