論文の概要: Biconvex Biclustering
- arxiv url: http://arxiv.org/abs/2604.03936v1
- Date: Sun, 05 Apr 2026 02:30:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.840166
- Title: Biconvex Biclustering
- Title(参考訳): Biconvex Biclustering
- Authors: Sam Rosen, Eric C. Chi, Jason Xu,
- Abstract要約: 本稿では,高次元環境下での性能向上を図るため,複クラスター化による複クラスター化を提案する。
ノイズの多い特徴のサブセットを選択するのとは対照的に,本手法は両クラスタを発見しながら情報的特徴の重み付けを共同で行う。
- 参考スコア(独自算出の注目度): 3.047033445144121
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article proposes a biconvex modification to convex biclustering in order to improve its performance in high-dimensional settings. In contrast to heuristics that discard a subset of noisy features a priori, our method jointly learns and accordingly weighs informative features while discovering biclusters. Moreover, the method is adaptive to the data, and is accompanied by an efficient algorithm based on proximal alternating minimization, complete with detailed guidance on hyperparameter tuning and efficient solutions to optimization subproblems. These contributions are theoretically grounded; we establish finite-sample bounds on the objective function under sub-Gaussian errors, and generalize these guarantees to cases where input affinities need not be uniform. Extensive simulation results reveal our method consistently recovers underlying biclusters while weighing and selecting features appropriately, outperforming peer methods. An application to a gene microarray dataset of lymphoma samples recovers biclusters matching an underlying classification, while giving additional interpretation to the mRNA samples via the column groupings and fitted weights.
- Abstract(参考訳): 本稿では,高次元環境下での性能向上を図るために,凸複クラスター化の両凸修正を提案する。
雑音のサブセットを破棄するヒューリスティックスとは対照的に,本手法は両クラスタを発見しながら情報的特徴を共同で学習し,その重み付けを行う。
さらに、この手法はデータに適応し、近似交互最小化に基づく効率的なアルゴリズムを伴い、ハイパーパラメータチューニングの詳細なガイダンスと最適化サブプロブレムの効率的な解法を完備する。
これらの寄与は理論的に根拠づけられており、準ガウス誤差の下で目的関数上の有限サンプル境界を確立し、入力親和性が一様でない場合にこれらの保証を一般化する。
大規模なシミュレーション結果から,提案手法はピア法よりも優れた特徴を適切に評価・選択しながら,基盤となる二クラスターを常に回復することが明らかとなった。
リンパ腫サンプルの遺伝子マイクロアレイデータセットへの応用は、基礎的な分類に適合したビスクラスターを回収し、カラムのグルーピングと装着重量を通じてmRNAサンプルにさらなる解釈を与える。
関連論文リスト
- k-HyperEdge Medoids for Clustering Ensemble [34.67281878600237]
クラスタリングアンサンブルはk-HyperEdge Medoids発見問題として定式化されている。
k-HyperEdge Medoidsに基づくクラスタリングアンサンブル法を提案する。
本手法の収束性は20データセットの実験的解析によって検証される。
論文 参考訳(メタデータ) (2024-12-11T11:04:17Z) - Optimal Algorithms for the Inhomogeneous Spiked Wigner Model [89.1371983413931]
不均一な問題に対する近似メッセージパッシングアルゴリズム(AMP)を導出する。
特に,情報理論の閾値よりも大きい信号と雑音の比を必要とする既知のアルゴリズムが,ランダムよりも優れた処理を行うための統計的・計算的ギャップの存在を同定する。
論文 参考訳(メタデータ) (2023-02-13T19:57:17Z) - A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0]
我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文 参考訳(メタデータ) (2023-02-06T23:34:51Z) - Robust convex biclustering with a tuning-free method [10.603857319905936]
本稿では,ハマーロスを用いた凸複クラスタリングアルゴリズムのロバストなバージョンを提案する。
新たに導入されたロバスト化パラメータは、最適なパラメータを選択するのに余分な負担をもたらす。
実生活のバイオメディカル・アプリケーションも紹介されている。
論文 参考訳(メタデータ) (2022-12-06T16:37:11Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。