Fugu-MT 論文翻訳(概要): A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data

論文の概要: A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data

arxiv url: http://arxiv.org/abs/2302.03157v1
Date: Mon, 6 Feb 2023 23:34:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-08 17:53:21.528504
Title: A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data
Title（参考訳）: クラスタデータと長手データの階層的モデリングに対する分布自由混合整数最適化手法
Authors: Madhav Sankaranarayanan, Intekhab Hossain
Abstract要約: クラスタ・アウェア・レグレッションのためのMIO(mixed-integer Optimization)アプローチを作成します。直流法である線形混合効果回帰法(LMEM)と比較した。我々の方法は非常に解釈可能な方法で定式化されているかを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We create a mixed-integer optimization (MIO) approach for doing cluster-aware regression, i.e. linear regression that takes into account the inherent clustered structure of the data. We compare to the linear mixed effects regression (LMEM) which is the most used current method, and design simulation experiments to show superior performance to LMEM in terms of both predictive and inferential metrics in silico. Furthermore, we show how our method is formulated in a very interpretable way; LMEM cannot generalize and make cluster-informed predictions when the cluster of new data points is unknown, but we solve this problem by training an interpretable classification tree that can help decide cluster effects for new data points, and demonstrate the power of this generalizability on a real protein expression dataset.
Abstract（参考訳）: 我々は、クラスタ対応回帰、すなわちデータ固有のクラスタ構造を考慮した線形回帰を行うための混合整数最適化(MIO)アプローチを作成する。直流法である線形混合効果回帰法 (LMEM) と比較し, シリコにおける予測指標と推論指標の両方の観点から, LMEMよりも優れた性能を示す設計シミュレーション実験を行った。 LMEMでは,新しいデータポイントのクラスタが未知の場合には,クラスタインフォームド予測を一般化し,クラスタインフォームド予測を行うことはできないが,新しいデータポイントのクラスタ効果を決定するための解釈可能な分類木を訓練し,この一般化可能性のパワーを実タンパク質表現データセット上で示すことによって,この問題を解決する。

関連論文リスト

An Enhanced Model-based Approach for Short Text Clustering [58.60681789677676]
Twitter、Google+、Facebookなどのソーシャルメディアの人気が高まり、短いテキストのクラスタリングがますます重要になっている。既存の手法は、トピックモデルに基づくアプローチと深層表現学習に基づくアプローチの2つのパラダイムに大別することができる。短文の空間性と高次元性を効果的に扱えるDirichlet Multinomial Mixture Model (GSDMM) のギブスサンプリングアルゴリズムを提案する。さらなる改良を保証しているGSDMMのいくつかの側面に基づいて,さらなる性能向上を目的とした改良されたアプローチであるGSDMM+を提案する。
論文参考訳（メタデータ） (2025-07-18T10:07:42Z)
Scalable Subset Selection in Linear Mixed Models [0.39373541926236766]
リニアモデル(LMM)は、パーソナライズドメディカルのような異種データを分析するための重要なツールである。 LMMの既存の手法は、数十から数百の予測値を超えない。 LMMサブセット選択の新しい方法は、数千の予測器を数秒から数分で含むデータセット上で実行できる。
論文参考訳（メタデータ） (2025-06-25T13:39:30Z)
Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文参考訳（メタデータ） (2025-05-21T07:16:44Z)
A Hybrid Mixture of $t$-Factor Analyzers for Clustering High-dimensional Data [0.07673339435080444]
本稿では,$t$-factor Analysisr (MtFA) の混合モデルを推定するための新しいハイブリッド手法を開発する。提案手法の有効性は,従来の手法と比較して計算効率が優れていることを示すシミュレーションによって実証される。本手法はガンマ線バーストのクラスタリングに応用され,ガンマ線バーストが不均質なサブ集団を持つという文献のいくつかの主張を補強し,推定群の特徴を与える。
論文参考訳（メタデータ） (2025-04-29T18:59:58Z)
Deep Generative Clustering with VAEs and Expectation-Maximization [1.8416014644193066]
本稿では,変分オートエンコーダ(VAE)を期待最大化フレームワークに統合する新しいディープクラスタリング手法を提案する。提案手法は,各クラスタの確率分布をVAEでモデル化し,モデルパラメータの更新を交互に行う。これにより、各クラスタから有効なクラスタリングと新しいサンプルの生成が可能になる。
論文参考訳（メタデータ） (2025-01-13T14:26:39Z)
Deep Matrix Factorization with Adaptive Weights for Multi-View Clustering [0.6037276428689637]
DMFAW(Adaptive Weights for Multi-View Clustering)を用いた新しいDeep Matrix Factorizationを提案する。提案手法は特徴選択を同時に組み込んで局所分割を生成し,クラスタリング結果を向上する。ベンチマークデータセットの実験では、DMFAWがクラスタリングのパフォーマンスで最先端のメソッドより優れていることが強調されている。
論文参考訳（メタデータ） (2024-12-03T09:08:27Z)
Fast Semisupervised Unmixing Using Nonconvex Optimization [80.11512905623417]
半/ライブラリベースのアンミックスのための新しい凸凸モデルを提案する。スパース・アンミキシングの代替手法の有効性を実証する。
論文参考訳（メタデータ） (2024-01-23T10:07:41Z)
Clustering based on Mixtures of Sparse Gaussian Processes [6.939768185086753]
低次元の組込み空間を使ってデータをクラスタする方法は、マシンラーニングにおいて依然として難しい問題である。本稿では,クラスタリングと次元還元の両立を目的とした共同定式化を提案する。我々のアルゴリズムはスパースガウス過程の混合に基づいており、スパースガウス過程混合クラスタリング(SGP-MIC)と呼ばれる。
論文参考訳（メタデータ） (2023-03-23T20:44:36Z)
Regularization and Optimization in Model-Based Clustering [4.096453902709292]
k-平均アルゴリズムの変種は、本質的に同じ球面ガウスの混合と、そのような分布から大きく逸脱するデータに適合する。一般のGMMに対してより効率的な最適化アルゴリズムを開発し、これらのアルゴリズムと正規化戦略を組み合わせ、過度な適合を避ける。これらの結果から, GMM と k-means 法の間の現状に新たな光を当て, 一般 GMM をデータ探索に利用することが示唆された。
論文参考訳（メタデータ） (2023-02-05T18:22:29Z)
Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。 iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文参考訳（メタデータ） (2022-09-29T21:03:13Z)
Random Manifold Sampling and Joint Sparse Regularization for Multi-label Feature Selection [0.0]
本稿では,$ell_2,1$および$ell_F$正規化の連立制約付き最適化問題を解くことで,最も関連性の高いいくつかの特徴を得ることができる。実世界のデータセットの比較実験により,提案手法が他の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2022-04-13T15:06:12Z)
Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文参考訳（メタデータ） (2022-02-01T19:25:31Z)
Spike-and-Slab Generalized Additive Models and Scalable Algorithms for High-Dimensional Data [0.0]
本稿では,高次元データに対応するため,階層型一般化加法モデル(GAM)を提案する。曲線の適切な縮退と滑らか化関数線型空間と非線形空間の分離に対する平滑化ペナルティを考察する。 2つの決定論的アルゴリズム、EM-Coordinate Descent と EM-Iterative Weighted Least Squares は異なるユーティリティ向けに開発された。
論文参考訳（メタデータ） (2021-10-27T14:11:13Z)
Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。 GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文参考訳（メタデータ） (2021-01-06T17:36:26Z)
Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文参考訳（メタデータ） (2020-12-29T04:08:38Z)
Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文参考訳（メタデータ） (2020-06-24T17:53:53Z)
Clustering Binary Data by Application of Combinatorial Optimization Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文参考訳（メタデータ） (2020-01-06T23:33:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。