論文の概要: Robust convex biclustering with a tuning-free method
- arxiv url: http://arxiv.org/abs/2212.03122v1
- Date: Tue, 6 Dec 2022 16:37:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 17:54:17.484088
- Title: Robust convex biclustering with a tuning-free method
- Title(参考訳): チューニングフリー手法によるロバスト凸複クラスタリング
- Authors: Yifan Chen, Chunyin Lei, Chuan-Quan Li, and Haiqiang Ma
- Abstract要約: 本稿では,ハマーロスを用いた凸複クラスタリングアルゴリズムのロバストなバージョンを提案する。
新たに導入されたロバスト化パラメータは、最適なパラメータを選択するのに余分な負担をもたらす。
実生活のバイオメディカル・アプリケーションも紹介されている。
- 参考スコア(独自算出の注目度): 10.603857319905936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biclustering is widely used in different kinds of fields including gene
information analysis, text mining, and recommendation system by effectively
discovering the local correlation between samples and features. However, many
biclustering algorithms will collapse when facing heavy-tailed data. In this
paper, we propose a robust version of convex biclustering algorithm with Huber
loss. Yet, the newly introduced robustification parameter brings an extra
burden to selecting the optimal parameters. Therefore, we propose a tuning-free
method for automatically selecting the optimal robustification parameter with
high efficiency. The simulation study demonstrates the more fabulous
performance of our proposed method than traditional biclustering methods when
encountering heavy-tailed noise. A real-life biomedical application is also
presented. The R package RcvxBiclustr is available at
https://github.com/YifanChen3/RcvxBiclustr.
- Abstract(参考訳): バイクラスタ化は遺伝子情報分析、テキストマイニング、レコメンデーションシステムなど様々な分野において、サンプルと特徴の局所相関を効果的に発見することにより広く利用されている。
しかし、重み付きデータに直面すると、多くのビクラスタリングアルゴリズムが崩壊する。
本稿では,ハマーロスを用いた凸複クラスタリングアルゴリズムの頑健なバージョンを提案する。
しかし、新しく導入されたロバスト化パラメータは、最適パラメータの選択に余計な負担をもたらす。
そこで本研究では,最適ロバスト化パラメータを高効率で自動選択するチューニングフリー手法を提案する。
シミュレーション実験により,重音に遭遇する場合の従来手法よりも,提案手法の優れた性能を示す。
実生活のバイオメディカル応用も紹介する。
RパッケージRcvxBiclustrはhttps://github.com/YifanChen3/RcvxBiclustrで入手できる。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Fast Semisupervised Unmixing Using Nonconvex Optimization [80.11512905623417]
半/ライブラリベースのアンミックスのための新しい凸凸モデルを提案する。
スパース・アンミキシングの代替手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-01-23T10:07:41Z) - A Modular Spatial Clustering Algorithm with Noise Specification [0.0]
細菌ファームアルゴリズムは、閉じた実験農場の細菌の成長にインスパイアされている。
他のクラスタリングアルゴリズムとは対照的に、我々のアルゴリズムはクラスタリング中に除外されるノイズの量を規定する機能も備えている。
論文 参考訳(メタデータ) (2023-09-18T18:05:06Z) - A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0]
我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文 参考訳(メタデータ) (2023-02-06T23:34:51Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Geometric Disentanglement by Random Convex Polytopes [3.6852491526879683]
深層学習から得られた表現の質を測定するための新しい幾何学的手法を提案する。
提案手法はランダム・ポリトープ記述法(Random Polytope Descriptor)と呼ばれ、ランダム・凸・ポリトープの構成に基づくデータポイントの効率的な記述を提供する。
論文 参考訳(メタデータ) (2020-09-29T13:16:26Z) - Stable and consistent density-based clustering via multiparameter
persistence [77.34726150561087]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。