Fugu-MT 論文翻訳(概要): Fitting Sparse Markov Models to Categorical Time Series Using Convex Clustering

論文の概要: Fitting Sparse Markov Models to Categorical Time Series Using Convex Clustering

arxiv url: http://arxiv.org/abs/2202.05485v2
Date: Wed, 02 Jul 2025 01:20:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-03 14:22:55.547688
Title: Fitting Sparse Markov Models to Categorical Time Series Using Convex Clustering
Title（参考訳）: 凸クラスタリングによるスパースマルコフモデルのカテゴリー時系列化
Authors: Tuhin Majumder, Soumendra Lahiri, Donald Martin,
Abstract要約: スパースマルコフモデル(SMM)による擬似モデリング手法本研究では,凸クラスタリングと正規化に基づくSMMの整合性向上のためのエレガントな手法を開発した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Higher-order Markov chains are frequently used to model categorical time series. However, a major problem with fitting such models is the exponentially growing number of parameters in the model order. A popular approach to parsimonious modeling is to use a Variable Length Markov Chain (VLMC), which determines relevant contexts (recent pasts) of variable orders and forms a context tree. A more general parsimonious modeling approach is given by Sparse Markov Models (SMMs), where all possible histories of order $m$ are partitioned such that the transition probability vectors are identical for the histories belonging to any particular group. In this paper, we develop an elegant method of fitting SMMs based on convex clustering and regularization. The regularization parameter is selected using the BIC criterion. Theoretical results establish model selection consistency of our method for large sample size. Extensive simulation results under different set-ups are presented to study finite sample performance of the method. Real data analysis on modelling and classifying disease sub-types demonstrates the applicability of our method as well.
Abstract（参考訳）: 高階マルコフ連鎖は分類的時系列をモデル化するのにしばしば用いられる。しかし、そのようなモデルに適合する際の大きな問題は、指数関数的に増加するモデルの順序におけるパラメータの数である。パーシホンス・モデリングの一般的なアプローチは可変長マルコフ・チェイン(VLMC)を使い、可変順序の関連するコンテキスト(最近の過去)を決定し、コンテキストツリーを形成することである。より一般的な擬似モデリングアプローチはスパースマルコフモデル(SMM)によって与えられ、任意の群に属するヒストリーに対して遷移確率ベクトルが同一となるように、位数$m$のすべての可能なヒストリーがパーティショニングされる。本稿では,凸クラスタリングと正規化に基づくSMMの整合性向上のためのエレガントな手法を開発する。 BIC基準を用いて正規化パラメータを選択する。理論的な結果から,本手法のモデル選択一貫性が確立された。提案手法の有限サンプル性能を調べるために, 異なる設定条件下での広範囲なシミュレーション結果を示す。疾患サブタイプのモデル化と分類に関する実データ分析は,本手法の適用可能性も示している。

関連論文リスト

Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。 RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文参考訳（メタデータ） (2025-09-29T01:40:26Z)
AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization [86.8133939108057]
異種MLLMに適した新しいモデルマージ手法であるAdaMMSを提案する。提案手法は,マッピング,マージ,検索という3段階の課題に対処する。ラベル付きデータ無しで異種MLLMをマージできる最初のモデルマージ手法として、AdaMMSは様々なビジョンベンチマークで過去のモデルマージ手法より優れている。
論文参考訳（メタデータ） (2025-03-31T05:13:02Z)
On the Expressiveness and Length Generalization of Selective State-Space Models on Regular Languages [56.22289522687125]
SSM(Selective State-space Model)はTransformerの代替品である。正規言語タスクにおける表現性や長さの一般化性能を解析する。本稿では,Selective Dense State-Space Model (SD-SSM)を紹介する。
論文参考訳（メタデータ） (2024-12-26T20:53:04Z)
Ensemble Methods for Sequence Classification with Hidden Markov Models [8.241486511994202]
隠れマルコフモデル(HMM)のためのアンサンブル手法を用いたシーケンス分類への軽量なアプローチを提案する。 HMMは、その単純さ、解釈可能性、効率性のために、不均衡または小さいデータセットを持つシナリオにおいて、大きな利点を提供する。アンサンブルに基づくスコアリング手法により,任意の長さのシーケンスの比較が可能となり,不均衡なデータセットの性能が向上する。
論文参考訳（メタデータ） (2024-09-11T20:59:32Z)
Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation [60.493180081319785]
本稿では,各復号工程における多様性とリスクのトレードオフを考慮し,トラクションサンプリング手法の本質的な能力を推定する体系的手法を提案する。本研究は,既存のトラクションサンプリング手法の総合的な比較と,ユーザのガイドラインとして推奨されるパラメータについて紹介する。
論文参考訳（メタデータ） (2024-08-24T14:14:32Z)
Random Models for Fuzzy Clustering Similarity Measures [0.0]
Adjusted Rand Index (ARI) は、ハードクラスタリングを比較するために広く使われている手法である。本稿では,ハードクラスタリングとファジィクラスタリングの両方に対して直感的で説明可能な3つのランダムモデルを用いて,ARIを計算するための単一のフレームワークを提案する。
論文参考訳（メタデータ） (2023-12-16T00:07:04Z)
Variable Clustering via Distributionally Robust Nodewise Regression [7.289979396903827]
可変クラスタリングのための多要素ブロックモデルについて検討し、ノード単位回帰の分布的ロバストなバージョンを定式化することにより、正規化サブスペースクラスタリングに接続する。我々は凸緩和を導出し、ロバスト領域のサイズを選択するためのガイダンスを与え、そのためデータに基づいて正規化重み付けパラメータを提案し、実装のためのADMMアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-12-15T16:23:25Z)
Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文参考訳（メタデータ） (2022-09-27T07:58:25Z)
Time Series Clustering with an EM algorithm for Mixtures of Linear Gaussian State Space Models [0.0]
線形ガウス状態空間モデルを混合したモデルに基づく時系列クラスタリング手法を提案する。提案手法では,混合モデルの予測最大化アルゴリズムを用いてモデルパラメータを推定する。シミュレーションデータセットの実験は、クラスタリング、パラメータ推定、モデル選択における手法の有効性を示す。
論文参考訳（メタデータ） (2022-08-25T07:41:23Z)
Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文参考訳（メタデータ） (2022-02-01T19:25:31Z)
Normalizing Flow based Hidden Markov Models for Classification of Speech Phones with Explainability [25.543231171094384]
説明可能性を求めるため,逐次データ生成モデルを開発した。我々は、現代のニューラルネットワーク(正規化フロー)と伝統的な生成モデル(隠れマルコフモデル - HMM)を組み合わせる。提案した生成モデルは、データの可能性を計算することができ、従って、最大形分類法(ML)に直接適合する。
論文参考訳（メタデータ） (2021-07-01T20:10:55Z)
Equivalence of Segmental and Neural Transducer Modeling: A Proof of Concept [56.46135010588918]
RNN-Transducerモデルとセグメントモデル(直接HMM)の広く使われているクラスが等価であることを証明する。空白確率はセグメント長確率に変換され,その逆も示された。
論文参考訳（メタデータ） (2021-04-13T11:20:48Z)
Robust Classification using Hidden Markov Models and Mixtures of Normalizing Flows [25.543231171094384]
我々は,隠れマルコフモデル(HMM)の状態遷移と,隠れたHMMの状態に対するニューラルネットワークに基づく確率分布を組み合わせた生成モデルを用いる。音声認識への応用におけるNMM-HMM分類器の堅牢性の改善を検証する。
論文参考訳（メタデータ） (2021-02-15T00:40:30Z)
Community Detection in the Stochastic Block Model by Mixed Integer Programming [3.8073142980733]
Degree-Corrected Block Model (DCSBM) は、コミュニティ構造を持つランダムグラフを生成する一般的なモデルである。 DCSBMに基づくコミュニティ検出の標準的なアプローチは、最大推定(MLE)により観測されたネットワークデータを生成する可能性が最も高いモデルパラメータを探索することである。本稿では,モデルパラメータと最大確率のコミュニティ割当を観測グラフから確実に求める数学的計画式と厳密解法を提案する。
論文参考訳（メタデータ） (2021-01-26T22:04:40Z)
Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文参考訳（メタデータ） (2020-10-25T18:51:15Z)
Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文参考訳（メタデータ） (2020-10-12T03:27:07Z)
Generalized Matrix Factorization: efficient algorithms for fitting generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。 GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文参考訳（メタデータ） (2020-10-06T04:28:19Z)
Semi-nonparametric Latent Class Choice Model with a Flexible Class Membership Component: A Mixture Model Approach [6.509758931804479]
提案したモデルは、従来のランダムユーティリティ仕様に代わるアプローチとして混合モデルを用いて潜在クラスを定式化する。その結果,混合モデルにより潜在クラス選択モデル全体の性能が向上した。
論文参考訳（メタデータ） (2020-07-06T13:19:26Z)
Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文参考訳（メタデータ） (2020-06-24T17:53:53Z)
Evaluating the Disentanglement of Deep Generative Models through Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文参考訳（メタデータ） (2020-06-05T20:54:11Z)
On the Discrepancy between Density Estimation and Sequence Generation [92.70116082182076]
log-likelihoodは、同じファミリー内のモデルを考えるとき、BLEUと非常に相関している。異なる家族間でのモデルランキングの相関はみられない。
論文参考訳（メタデータ） (2020-02-17T20:13:35Z)
Clustering Binary Data by Application of Combinatorial Optimization Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文参考訳（メタデータ） (2020-01-06T23:33:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。