論文の概要: AutoGMM: Automatic Gaussian Mixture Modeling in Python
- arxiv url: http://arxiv.org/abs/1909.02688v6
- Date: Tue, 09 Sep 2025 02:59:46 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-09-14 13:27:32.838784
- Title: AutoGMM: Automatic Gaussian Mixture Modeling in Python
- Title(参考訳): AutoGMM: Pythonの自動ガウス混合モデリング
- Authors: Tingshan Liu, Thomas L. Athey, Benjamin D. Pedigo, Joshua T. Vogelstein,
- Abstract要約: AutoGMMは、情報基準によるモデルの選択を自動化するPythonパッケージである。
古典的なベンチマーク、目標とするストレステスト、および2つの実際のランタイムデータセット上での強力なアウト・オブ・ボックスのパフォーマンスが得られる。
- 参考スコア(独自算出の注目度): 4.888152316175764
- License:
- Abstract: The exponential growth of complex data demands fully automatic clustering. Gaussian mixture models (GMMs) provide uncertainty-aware grouping but often require expertise to specify hyperparameters, e.g., component count and covariance structure. While mclust (R) automates this via Bayesian Information Criterion (BIC), Python lacks a comparable tool. We introduce AutoGMM, an open-source Python package automating GMM via strategic initialization using an agglomerative Mahalanobis heuristic, and parallelized model selection by information criteria. AutoGMM is a drop-in tool that yields strong out-of-the-box performance on classic benchmarks, targeted stress tests, and two real datasets, with favorable runtime scaling. The code is available at https://github.com/neurodata/AutoGMM with tests and reproducible workflows.
- Abstract(参考訳): 複雑なデータの指数関数的な成長は、完全な自動クラスタリングを必要とする。
ガウス混合モデル(GMM)は不確実性を認識したグルーピングを提供するが、しばしばハイパーパラメータ、例えば成分数、共分散構造を特定する専門知識を必要とする。
mclust (R)はBayesian Information Criterion (BIC)を通じてこれを自動化しているが、Pythonには同等のツールがない。
本稿では,Agglomerative Mahalanobis heuristicを用いてGMMを戦略的初期化することで,GMMを自動生成するオープンソースのPythonパッケージであるAutoGMMを紹介した。
AutoGMMは、古典的なベンチマーク、ターゲットストレステスト、および2つの実際のデータセットに対する強力なアウトオブボックスパフォーマンスを実現する、ドロップインツールである。
コードはhttps://github.com/neurodata/AutoGMMでテストと再現可能なワークフローが提供されている。
関連論文リスト
- HGMF: A Hierarchical Gaussian Mixture Framework for Scalable Tool Invocation within the Model Context Protocol [16.890180802987135]
外部ツールを呼び出すことで、LLM(Large Language Models)は複雑な実世界のタスクを実行できる。
しかし、大きく階層的に構造化されたライブラリから正しいツールを選択することは大きな課題です。
本稿では,スケーラブルなツール実行のための確率的プルーニング手法である階層型ガウス混合フレームワーク(HGMF)を提案する。
論文 参考訳(メタデータ) (2025-08-11T04:13:06Z) - Reinforced Model Merging [53.84354455400038]
本稿では,タスク統合に適した環境とエージェントを含むRMM(Reinforced Model Merging)という,革新的なフレームワークを提案する。
評価プロセス中にデータサブセットを利用することで、報酬フィードバックフェーズのボトルネックに対処し、RMMを最大100倍高速化する。
論文 参考訳(メタデータ) (2025-03-27T08:52:41Z) - Mixture-Models: a one-stop Python Library for Model-based Clustering
using various Mixture Models [4.60168321737677]
textttMixture-Modelsは、Gaussian Mixture Models(GMM)とその変種を適合させるオープンソースのPythonライブラリである。
様々な第1/第2次最適化ルーチンを使用して、これらのモデルの実装と分析を合理化する。
このライブラリは、BIC、AIC、ログライクな推定など、ユーザフレンドリーなモデル評価ツールを提供する。
論文 参考訳(メタデータ) (2024-02-08T19:34:24Z) - The Gaussian-Linear Hidden Markov model: a Python package [0.06282171844772422]
本稿では、神経科学で一般的に用いられる様々なタイプのHMMの一般化を提案する。
GLHMMは統計テストとサンプル外予測を重視したPythonツールボックスとして実装されている。
実演では、fMRI、脳波、脳磁図、瞳孔計の例を示す。
論文 参考訳(メタデータ) (2023-12-12T10:41:04Z) - PyHHMM: A Python Library for Heterogeneous Hidden Markov Models [63.01207205641885]
PyHHMM は Heterogeneous-Hidden Markov Models (HHMM) のオブジェクト指向Python実装である。
PyHHMMは、異種観測モデル、データ推論の欠如、異なるモデルの順序選択基準、半教師付きトレーニングなど、同様のフレームワークではサポートされない機能を強調している。
PyHHMMは、numpy、scipy、scikit-learn、およびシーボーンPythonパッケージに依存しており、Apache-2.0ライセンスの下で配布されている。
論文 参考訳(メタデータ) (2022-01-12T07:32:36Z) - Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。
生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。
我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-04-19T12:26:26Z) - Image Modeling with Deep Convolutional Gaussian Mixture Models [79.0660895390689]
画像の記述と生成に適したGMM(Deep Hierarchical Gaussian Mixture Models)の新しい定式化を紹介します。
DCGMMは、畳み込みとプーリング操作によってリンクされた複数のGMM層の積み重ねたアーキテクチャによってこれを回避している。
dcgmmsでシャープな画像を生成するために,畳み込みやプーリングなどの非可逆操作をサンプリングする新しい勾配に基づく手法を提案する。
MNISTとFashionMNISTのデータセットに基づいて,クラスタリング,サンプリング,外乱検出において,フラットなGMMよりも優れていることを示すことで,DCGMMsモデルを検証した。
論文 参考訳(メタデータ) (2021-04-19T12:08:53Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z) - AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data [120.2298620652828]
オープンソースのAutoMLフレームワークであるAutoGluon-Tabularを紹介します。
KaggleとOpenML AutoML Benchmarkの50の分類および回帰タスクからなるスイートのテストによると、AutoGluonはより速く、より堅牢で、はるかに正確である。
論文 参考訳(メタデータ) (2020-03-13T23:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。