論文の概要: Extension of the Dip-test Repertoire -- Efficient and Differentiable
p-value Calculation for Clustering
- arxiv url: http://arxiv.org/abs/2312.12050v1
- Date: Tue, 19 Dec 2023 11:14:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 15:48:24.914979
- Title: Extension of the Dip-test Repertoire -- Efficient and Differentiable
p-value Calculation for Clustering
- Title(参考訳): Dip-test Repertoireの拡張 --クラスタリングのための効率的かつ微分可能なp値計算
- Authors: Lena G. M. Bauer and Collin Leiber and Christian B\"ohm and Claudia
Plant
- Abstract要約: 一様性のディップテスト(英: Dip-test of unimodality)は、1次元サンプルのモダリティを確実に評価するパラメータフリーな統計テストである。
多くのDipベースのクラスタリングアルゴリズムは、ある程度のサンプルサイズでDip-からDip-p-値に変換するブートストラップ付きルックアップテーブルを使用している。
本稿では、これらの最先端のルックアップテーブルの代用として、特別に設計されたシグモイド関数を提案する。
- 参考スコア(独自算出の注目度): 11.977836142288508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the last decade, the Dip-test of unimodality has gained increasing
interest in the data mining community as it is a parameter-free statistical
test that reliably rates the modality in one-dimensional samples. It returns a
so called Dip-value and a corresponding probability for the sample's
unimodality (Dip-p-value). These two values share a sigmoidal relationship.
However, the specific transformation is dependent on the sample size. Many
Dip-based clustering algorithms use bootstrapped look-up tables translating
Dip- to Dip-p-values for a certain limited amount of sample sizes. We propose a
specifically designed sigmoid function as a substitute for these
state-of-the-art look-up tables. This accelerates computation and provides an
approximation of the Dip- to Dip-p-value transformation for every single sample
size. Further, it is differentiable and can therefore easily be integrated in
learning schemes using gradient descent. We showcase this by exploiting our
function in a novel subspace clustering algorithm called Dip'n'Sub. We
highlight in extensive experiments the various benefits of our proposal.
- Abstract(参考訳): 過去10年間で、一様性(unimodality)のディップテストは、1次元サンプルのモダリティを確実に評価するパラメータフリーな統計テストであるため、データマイニングコミュニティの関心が高まっている。
これはいわゆるディップ値とサンプルのユニモダリティ(dip-p-値)の対応する確率を返す。
これら2つの値はs状骨関係を共有している。
しかし、特定の変換はサンプルサイズに依存する。
多くのdipベースのクラスタリングアルゴリズムは、特定の限られた量のサンプルサイズでdipからdip-p値に変換するブートストラップされたルックアップテーブルを使用する。
そこで本稿では, 最先端のルックアップテーブルの代用として, 特別に設計されたsgmoid関数を提案する。
これにより計算が加速され、サンプルサイズごとにディップからディップp値への変換が近似される。
さらに、微分可能であり、従って勾配降下を用いた学習スキームに容易に統合できる。
我々は、dip'n'subと呼ばれる新しい部分空間クラスタリングアルゴリズムで、我々の機能を活用して、これを示す。
我々は、提案の様々な利点を広範囲に実験で強調する。
関連論文リスト
- Generative modeling of density regression through tree flows [3.0262553206264893]
本稿では,表データの密度回帰タスクに適したフローベース生成モデルを提案する。
本稿では,木質変換を分割・対数戦略を用いて適合させる学習アルゴリズムを提案する。
本手法は, トレーニングおよびサンプリング予算のごく一部において, 同等あるいは優れた性能を継続的に達成する。
論文 参考訳(メタデータ) (2024-06-07T21:07:35Z) - CKD: Contrastive Knowledge Distillation from A Sample-wise Perspective [48.99488315273868]
本研究では,試料内およびサンプル間制約によるサンプルワイドアライメント問題として定式化できる,対照的な知識蒸留手法を提案する。
本手法は, 数値を考慮し, 同一試料中のロジット差を最小化する。
CIFAR-100, ImageNet-1K, MS COCOの3つのデータセットについて総合的な実験を行った。
論文 参考訳(メタデータ) (2024-04-22T11:52:40Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Subspace clustering in high-dimensions: Phase transitions \&
Statistical-to-Computational gap [24.073221004661427]
部分空間クラスタリングを研究するための単純なモデルは、高次元の$k$-ガウス混合モデルである。
広帯域な高次元状態における統計的に最適な再構成誤差を正確に評価する。
論文 参考訳(メタデータ) (2022-05-26T17:47:35Z) - Bayes in Wonderland! Predictive supervised classification inference hits
unpredictability [1.8814209805277506]
デ・フィネッティ型の交換性の下でsBpcとmBpcの収束を示す。
また、分割交換可能なシーケンスを生じる生成モデルのパラメータ推定も行う。
論文 参考訳(メタデータ) (2021-12-03T12:34:52Z) - Sensing Cox Processes via Posterior Sampling and Positive Bases [56.82162768921196]
本研究では,空間統計学から広く用いられている点過程の適応センシングについて検討する。
我々は、この強度関数を、特別に構築された正の基底で表される、歪んだガウス過程のサンプルとしてモデル化する。
我々の適応センシングアルゴリズムはランゲヴィン力学を用いており、後続サンプリング(textscCox-Thompson)と後続サンプリング(textscTop2)の原理に基づいている。
論文 参考訳(メタデータ) (2021-10-21T14:47:06Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - An Embedded Model Estimator for Non-Stationary Random Functions using
Multiple Secondary Variables [0.0]
本稿では,本手法を導入し,地理的モデリングや量子ランダムフォレストに適用した結果と自然に類似した一貫性を有することを示す。
このアルゴリズムは、各ターゲット位置におけるターゲット変数の条件分布を推定することで機能する。
論文 参考訳(メタデータ) (2020-11-09T00:14:24Z) - Carath\'eodory Sampling for Stochastic Gradient Descent [79.55586575988292]
本稿では,Tchakaloff と Carath'eodory の古典的な結果から着想を得た手法を提案する。
我々は、測定値の低減を行う降下ステップを適応的に選択する。
これをBlock Coordinate Descentと組み合わせることで、測定の削減を極めて安価に行えるようにします。
論文 参考訳(メタデータ) (2020-06-02T17:52:59Z) - Gaussianization Flows [113.79542218282282]
そこで本研究では,サンプル生成における効率のよい繰り返しと効率のよい逆変換を両立できる新しい型正規化フローモデルを提案する。
この保証された表現性のため、サンプル生成の効率を損なうことなく、マルチモーダルなターゲット分布をキャプチャできる。
論文 参考訳(メタデータ) (2020-03-04T08:15:06Z) - Learning to Importance Sample in Primary Sample Space [22.98252856114423]
本稿では,ニューラルネットワークを用いて,サンプルの集合に代表される所望密度からサンプルを抽出する方法を学習する,新たな重要サンプリング手法を提案する。
提案手法は, 様々なシナリオにおいて, 効果的な分散低減につながることを示す。
論文 参考訳(メタデータ) (2018-08-23T16:55:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。