論文の概要: Cluster-Based Generalized Additive Models Informed by Random Fourier Features
- arxiv url: http://arxiv.org/abs/2512.19373v1
- Date: Mon, 22 Dec 2025 13:15:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.767
- Title: Cluster-Based Generalized Additive Models Informed by Random Fourier Features
- Title(参考訳): ランダムフーリエ特徴を用いたクラスタベース一般化付加モデル
- Authors: Xin Huang, Jia Li, Jun Yu,
- Abstract要約: この研究は、データ内の局所適応構造を明らかにするために、ランダムフーリエ特徴(RFF)表現を利用する一般化加法モデル(GAM)の混合を導入している。
カリフォルニアハウジング、NASA Air Self-Noise、Bike Sharingデータセットなど、実世界の回帰ベンチマークに関する数値実験は、予測性能の向上を実証している。
- 参考スコア(独自算出の注目度): 19.409397281817288
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Explainable machine learning aims to strike a balance between prediction accuracy and model transparency, particularly in settings where black-box predictive models, such as deep neural networks or kernel-based methods, achieve strong empirical performance but remain difficult to interpret. This work introduces a mixture of generalized additive models (GAMs) in which random Fourier feature (RFF) representations are leveraged to uncover locally adaptive structure in the data. In the proposed method, an RFF-based embedding is first learned and then compressed via principal component analysis. The resulting low-dimensional representations are used to perform soft clustering of the data through a Gaussian mixture model. These cluster assignments are then applied to construct a mixture-of-GAMs framework, where each local GAM captures nonlinear effects through interpretable univariate smooth functions. Numerical experiments on real-world regression benchmarks, including the California Housing, NASA Airfoil Self-Noise, and Bike Sharing datasets, demonstrate improved predictive performance relative to classical interpretable models. Overall, this construction provides a principled approach for integrating representation learning with transparent statistical modeling.
- Abstract(参考訳): 説明可能な機械学習は、予測精度とモデルの透明性のバランスをとることを目的としており、特にディープニューラルネットワークやカーネルベースの手法のようなブラックボックス予測モデルが強い経験的パフォーマンスを達成するが、解釈が困難であるような環境では特にそうだ。
この研究は、データ内の局所適応構造を明らかにするために、ランダムフーリエ特徴(RFF)表現を利用する一般化加法モデル(GAM)の混合を導入している。
提案手法では、まずRFFベースの埋め込みを学習し、次に主成分分析により圧縮する。
結果の低次元表現はガウス混合モデルを通してデータのソフトクラスタリングを行うために用いられる。
これらのクラスタ割り当てをGAMの混合フレームワークの構築に適用し、各局所GAMは解釈可能な単変数の滑らかな関数を通して非線形効果をキャプチャする。
カリフォルニア・ハウジング、NASAエアフォイル・セルフノイズ、自転車シェアリングといった実世界の回帰ベンチマークに関する数値実験では、古典的な解釈可能なモデルと比較して予測性能が改善された。
全体として、この構成は、表現学習と透過的な統計的モデリングを統合するための原則的なアプローチを提供する。
関連論文リスト
- Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文 参考訳(メタデータ) (2025-10-16T03:37:16Z) - Boosting Generalization Performance in Model-Heterogeneous Federated Learning Using Variational Transposed Convolution [0.27309692684728615]
Federated Learning(FL)は、分散クライアントがローカルデータを効率的に処理できるようにする、先駆的な機械学習パラダイムである。
従来のモデル均質なアプローチは、主に局所的なトレーニング手順を正規化したり、集約においてクライアントの重みを動的に調整したりする。
モデルアグリゲーションなしで未確認データに対するクライアントの一般化性能を向上させるモデル不均一FLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-03T08:55:18Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - Adaptive Transfer Clustering: A Unified Framework [2.3144964550307496]
本稿では,未知の相違点が存在する場合の共通性を自動的に活用するアダプティブ・トランスファー・クラスタリング(ATC)アルゴリズムを提案する。
これはガウス混合モデル、ブロックモデル、潜在クラスモデルを含む幅広い統計モデルに適用される。
論文 参考訳(メタデータ) (2024-10-28T17:57:06Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Functional Mixtures-of-Experts [0.24578723416255746]
観測対象が関数を含む状況下での予測のための異種データの統計的解析について検討する。
まず,機能的ME(FME)と呼ばれる新しいMEモデルのファミリーを提示する。
我々は,モデルに適合する最大パラメータ推定戦略を定式化したLasso-like (EM-Lasso) の専用予測-最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-02-04T17:32:28Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。