論文の概要: FastAMI -- a Monte Carlo Approach to the Adjustment for Chance in
Clustering Comparison Metrics
- arxiv url: http://arxiv.org/abs/2305.03022v1
- Date: Wed, 3 May 2023 09:23:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 14:26:32.340379
- Title: FastAMI -- a Monte Carlo Approach to the Adjustment for Chance in
Clustering Comparison Metrics
- Title(参考訳): FastAMI - クラスタリング比較メトリクスにおけるチャンス調整へのモンテカルロアプローチ
- Authors: Kai Klede, Leo Schwinn, Dario Zanca, Bj\"orn Eskofier
- Abstract要約: 我々は、調整された相互情報(AMI)を効率的に近似するモンテカルロ法であるFastAMIを提案する。
この手法は、ペア幅の置換に基づくAMIの正確な計算と最近開発された変種と比較される。
正確な計算とは対照的に、我々の手法は、大規模なデータセットに対するこれらの調整された情報理論の比較を可能にするのに十分な速度である。
- 参考スコア(独自算出の注目度): 2.1028463367241033
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering is at the very core of machine learning, and its applications
proliferate with the increasing availability of data. However, as datasets
grow, comparing clusterings with an adjustment for chance becomes
computationally difficult, preventing unbiased ground-truth comparisons and
solution selection. We propose FastAMI, a Monte Carlo-based method to
efficiently approximate the Adjusted Mutual Information (AMI) and extend it to
the Standardized Mutual Information (SMI). The approach is compared with the
exact calculation and a recently developed variant of the AMI based on pairwise
permutations, using both synthetic and real data. In contrast to the exact
calculation our method is fast enough to enable these adjusted
information-theoretic comparisons for large datasets while maintaining
considerably more accurate results than the pairwise approach.
- Abstract(参考訳): クラスタリングは機械学習の核心であり、その応用はデータの可用性の増加とともに広まっている。
しかしデータセットが成長するにつれて、クラスタリングと確率調整を比較する計算が難しくなり、偏りのない接地比較や解選択が防止される。
本稿では,調整された相互情報(ami)を効率的に近似し,標準化相互情報(smi)に拡張する,モンテカルロに基づくファスタミを提案する。
この手法は、合成データと実データの両方を用いて、ペアの置換に基づくAMIの正確な計算と最近開発された変種と比較する。
正確な計算とは対照的に、我々の手法は、大きなデータセットに対するこれらの調整された情報理論の比較を可能にするのに十分高速であり、ペアワイズアプローチよりもはるかに正確な結果を維持する。
関連論文リスト
- Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - SMIXS: Novel efficient algorithm for non-parametric mixture
regression-based clustering [0.0]
縦方向データ解析のための非パラメトリック回帰に基づくクラスタリングアルゴリズムを開発した。
クラスタリングおよび回帰性能の観点から,合成データセット上でのGMMよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-09-19T14:03:51Z) - Data Fusion with Latent Map Gaussian Processes [0.0]
多要素モデリングとキャリブレーションは、エンジニアリング設計においてユビキタスに発生するデータ融合タスクである。
本稿では,遅延マップガウス過程(LMGP)に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-04T00:54:19Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Dual Optimization for Kolmogorov Model Learning Using Enhanced Gradient
Descent [8.714458129632158]
コルモゴロフモデル(コルモゴロフモデル、英: Kolmogorov model、KM)は、確率変数の集合の基本的な確率構造を学ぶための解釈可能で予測可能な表現手法である。
正規化双対最適化と拡張勾配降下法(GD)を併用した計算スケーラブルなKM学習アルゴリズムを提案する。
提案したKM学習アルゴリズムを用いた論理的関係マイニングの精度は80%以上である。
論文 参考訳(メタデータ) (2021-07-11T10:33:02Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Scaling Bayesian inference of mixed multinomial logit models to very
large datasets [9.442139459221785]
本稿では,バックプロパゲーション,自動微分,GPU加速計算を活用するアモルティファイド変分推論手法を提案する。
本研究では, 後部近似の柔軟性を高めるために, フローの正規化がいかに有効かを示す。
論文 参考訳(メタデータ) (2020-04-11T15:30:47Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。