論文の概要: Decomposing Gaussians with Unknown Covariance
- arxiv url: http://arxiv.org/abs/2409.11497v1
- Date: Tue, 17 Sep 2024 18:56:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 20:09:46.010516
- Title: Decomposing Gaussians with Unknown Covariance
- Title(参考訳): 未知の共分散を持つガウスの分解
- Authors: Ameer Dharamshi, Anna Neufeld, Lucy L. Gao, Jacob Bien, Daniela Witten,
- Abstract要約: 本稿では,ガウスデータに対する従来の分解手法をすべて包含する一般アルゴリズムを提案する。
これは$n>1$の場合にサンプル分割に代わる、より柔軟でフレキシブルな代替となる。
これらの分解を、代替戦略が利用できない設定において、モデル選択と選択後推論のタスクに適用する。
- 参考スコア(独自算出の注目度): 3.734088413551237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Common workflows in machine learning and statistics rely on the ability to partition the information in a data set into independent portions. Recent work has shown that this may be possible even when conventional sample splitting is not (e.g., when the number of samples $n=1$, or when observations are not independent and identically distributed). However, the approaches that are currently available to decompose multivariate Gaussian data require knowledge of the covariance matrix. In many important problems (such as in spatial or longitudinal data analysis, and graphical modeling), the covariance matrix may be unknown and even of primary interest. Thus, in this work we develop new approaches to decompose Gaussians with unknown covariance. First, we present a general algorithm that encompasses all previous decomposition approaches for Gaussian data as special cases, and can further handle the case of an unknown covariance. It yields a new and more flexible alternative to sample splitting when $n>1$. When $n=1$, we prove that it is impossible to partition the information in a multivariate Gaussian into independent portions without knowing the covariance matrix. Thus, we use the general algorithm to decompose a single multivariate Gaussian with unknown covariance into dependent parts with tractable conditional distributions, and demonstrate their use for inference and validation. The proposed decomposition strategy extends naturally to Gaussian processes. In simulation and on electroencephalography data, we apply these decompositions to the tasks of model selection and post-selection inference in settings where alternative strategies are unavailable.
- Abstract(参考訳): 機械学習と統計学における一般的なワークフローは、データセット内の情報を独立した部分に分割する能力に依存している。
最近の研究では、従来のサンプル分割ができない場合(例えば、サンプルの数が$n=1$である場合や、観測が独立で同一に分散していない場合)でも、このことが可能であることが示されている。
しかし、現在多変量ガウスデータを分解できるアプローチは共分散行列の知識を必要とする。
多くの重要な問題(空間的・縦断的なデータ解析やグラフィカルモデリングなど)において、共分散行列は未知であり、一次的関心事でさえある。
したがって、この研究において、未知の共分散を持つガウス群を分解する新しいアプローチを開発する。
まず,ガウスデータの過去の分解アプローチをすべて特殊ケースとして包含し,未知の共分散の場合をさらに処理できる一般アルゴリズムを提案する。
これは$n>1$の場合にサンプル分割に代わる、より柔軟でフレキシブルな代替となる。
n=1$のとき、共分散行列を知らずに多変量ガウスの情報を独立部分に分割することは不可能である。
したがって、一般アルゴリズムを用いて、未知の共分散を持つ1つの多変量ガウスを、トラクタブルな条件分布を持つ依存部分に分解し、推論と検証に使用することを示す。
提案された分解戦略はガウス過程に自然に拡張される。
シミュレーションおよび脳波データにおいて、これらの分解を、代替戦略が利用できない環境でのモデル選択および選択後推論のタスクに適用する。
関連論文リスト
- Learning general Gaussian mixtures with efficient score matching [16.06356123715737]
我々は、$d$次元で$k$ガウシアンの混合を学習する問題を研究する。
我々は、下層の混合成分について分離を前提としない。
我々は、ターゲット混合物から$dmathrmpoly(k/varepsilon)$サンプルを抽出し、サンプル-ポリノミカル時間で実行し、サンプリング器を構築するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-29T17:30:36Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Unsupervised Anomaly and Change Detection with Multivariate
Gaussianization [8.508880949780893]
データの高次元性を考えると、異常検出は難しい問題である。
本稿では,リモートセンシング画像の異常や変化を検出する教師なし手法を提案する。
異常検出と変化検出の両方を含む実験において,本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-04-12T10:52:33Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Nonlinear Distribution Regression for Remote Sensing Applications [6.664736150040092]
多くのリモートセンシングアプリケーションでは、観察から関心のある変数やパラメータを推定したい。
ニューラルネットワーク、ランダムフォレスト、ガウス過程などの標準アルゴリズムは、これら2つに関連して容易に利用可能である。
本稿では, グループ化されたデータの統計を仮定することなく, 従来の問題を解く非線形(カーネルベース)な分散回帰法を提案する。
論文 参考訳(メタデータ) (2020-12-07T22:04:43Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。