論文の概要: The Cellwise Minimum Covariance Determinant Estimator
- arxiv url: http://arxiv.org/abs/2207.13493v1
- Date: Wed, 27 Jul 2022 12:33:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 13:45:24.911737
- Title: The Cellwise Minimum Covariance Determinant Estimator
- Title(参考訳): セルワイズ最小共分散式推定器
- Authors: Jakob Raymaekers and Peter J. Rousseeuw
- Abstract要約: そこで本研究では,MCD方式のセルワイド・ロバストなバージョンであるCellMCDを提案する。
セルワイド・アウトリーのシミュレーションでは良好に動作し、クリーンなデータに対する有限サンプル効率が高い。
結果を視覚化した実データで示される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The usual Minimum Covariance Determinant (MCD) estimator of a covariance
matrix is robust against casewise outliers. These are cases (that is, rows of
the data matrix) that behave differently from the majority of cases, raising
suspicion that they might belong to a different population. On the other hand,
cellwise outliers are individual cells in the data matrix. When a row contains
one or more outlying cells, the other cells in the same row still contain
useful information that we wish to preserve. We propose a cellwise robust
version of the MCD method, called cellMCD. Its main building blocks are
observed likelihood and a sparsity penalty on the number of flagged cellwise
outliers. It possesses good breakdown properties. We construct a fast algorithm
for cellMCD based on concentration steps (C-steps) that always lower the
objective. The method performs well in simulations with cellwise outliers, and
has high finite-sample efficiency on clean data. It is illustrated on real data
with visualizations of the results.
- Abstract(参考訳): 共分散行列の通常の最小共分散決定式 (MCD) 推定器は、ケースワイドの外れ値に対して頑健である。
これらのケース(つまりデータマトリクスの行)は、ほとんどのケースと異なる振る舞いをしており、異なる集団に属するのではないかという疑念を呼んでいる。
一方、セルワイド・アウトレイアはデータマトリックス内の個々のセルである。
行が1つ以上の外側の細胞を含むとき、同じ列にある他の細胞は、保存したい有用な情報を含む。
そこで本研究では,MCD方式のセルワイドロバストバージョンであるCellMCDを提案する。
主要なビルディングブロックは観測可能性があり、フラグ付きセルワイズ異常数のスパルシティペナルティが課せられる。
優れた破壊特性を有する。
我々は,常に目標を下げる濃度ステップ(Cステップ)に基づくセルMCDの高速アルゴリズムを構築した。
本手法はセルワイド・アウトリーのシミュレーションにおいて良好に動作し,クリーンデータに対する有限サンプル効率が高い。
実データ上には結果の可視化が図示されている。
関連論文リスト
- Lower-dimensional projections of cellular expression improves cell type classification from single-cell RNA sequencing [12.66369956714212]
単細胞RNAシークエンシング(scRNA-seq)は単細胞レベルでの細胞多様性の研究を可能にする。
細胞型分類には, 統計的, 機械的, 深層学習に基づく様々な手法が提案されている。
本研究では,EnProCellと呼ばれる細胞型分類のための参照型手法を提案する。
論文 参考訳(メタデータ) (2024-10-13T19:01:38Z) - Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.31109141089598]
シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文 参考訳(メタデータ) (2023-11-28T08:34:58Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Contrastive Cycle Adversarial Autoencoders for Single-cell Multi-omics
Alignment and Integration [0.0]
本稿では,単一セルRNA-seqデータと単一セルATAC-seqデータとの整合と統合のための新しいフレームワークを提案する。
他の最先端手法と比較して,本手法はシミュレーションデータと実シングルセルデータの両方において優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-12-05T13:00:58Z) - Solving weakly supervised regression problem using low-rank manifold
regularization [77.34726150561087]
我々は弱い教師付き回帰問題を解く。
weakly"の下では、いくつかのトレーニングポイントではラベルが知られ、未知のものもあれば、無作為なノイズの存在やリソースの欠如などの理由によって不確かであることが分かっています。
数値的な節ではモンテカルロモデルを用いて提案手法を人工と実のデータセットに適用した。
論文 参考訳(メタデータ) (2021-04-13T23:21:01Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Classification Beats Regression: Counting of Cells from Greyscale
Microscopic Images based on Annotation-free Training Samples [20.91256120719461]
本研究は、注釈付きトレーニング画像を用いることなく、グレースケールの顕微鏡画像から細胞をカウントする教師あり学習フレームワークを提案する。
我々は、セルカウントタスクを画像分類問題として定式化し、セルカウントをクラスラベルとする。
これらの制約に対処するために,未確認の細胞数に対する画像の合成を行う,単純だが効果的なデータ拡張法を提案する。
論文 参考訳(メタデータ) (2020-10-28T06:19:30Z) - Outlier detection in non-elliptical data by kernel MRCD [10.69910379275607]
Kernel Minimum Regularized Covariance Determinant (KMRCD) 推定器を提案する。
カーネル誘導特徴空間におけるMRCD推定値を暗黙的に計算する。
カーネルベースの初期推定から始まり、カーネルのトリックを利用して、その後の計算を高速化する高速アルゴリズムが構築されている。
論文 参考訳(メタデータ) (2020-08-05T11:09:08Z) - Split and Expand: An inference-time improvement for Weakly Supervised
Cell Instance Segmentation [71.50526869670716]
本研究では,分割マップのインスタンスへの変換を改善するために,2段階の後処理手順であるSplitとExpandを提案する。
Splitのステップでは,セルの集合をセグメント化マップから個々のセルインスタンスに分割し,セル中心の予測を導出する。
拡張ステップでは、細胞中心予測を用いて、小さな細胞が欠落していることが分かる。
論文 参考訳(メタデータ) (2020-07-21T14:05:09Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。