論文の概要: AI Giving Back to Statistics? Discovery of the Coordinate System of
Univariate Distributions by Beta Variational Autoencoder
- arxiv url: http://arxiv.org/abs/2004.02687v1
- Date: Mon, 6 Apr 2020 14:11:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:42:31.521043
- Title: AI Giving Back to Statistics? Discovery of the Coordinate System of
Univariate Distributions by Beta Variational Autoencoder
- Title(参考訳): AIは統計に戻すか?
β変分オートエンコーダによる不定値分布の座標系の発見
- Authors: Alex Glushkovsky
- Abstract要約: 本稿では、単変量経験分布を分類し、累積分布関数(CDF)の入力に基づいて2次元の潜伏空間で表現するためのニューラルネットワークのトレーニング経験について論じる。
潜在2次元座標系上の表現は、CDFの形状、基礎となる理論分布とそのパラメータの分類確率、情報エントロピー、歪みなど、重要な分布特性を乱す実世界のデータの付加メタデータと見なすことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distributions are fundamental statistical elements that play essential
theoretical and practical roles. The article discusses experiences of training
neural networks to classify univariate empirical distributions and to represent
them on the two-dimensional latent space forcing disentanglement based on the
inputs of cumulative distribution functions (CDF). The latent space
representation has been performed using an unsupervised beta variational
autoencoder (beta-VAE). It separates distributions of different shapes while
overlapping similar ones and empirically realises relationships between
distributions that are known theoretically. The synthetic experiment of
generated univariate continuous and discrete (Bernoulli) distributions with
varying sample sizes and parameters has been performed to support the study.
The representation on the latent two-dimensional coordinate system can be seen
as an additional metadata of the real-world data that disentangles important
distribution characteristics, such as shape of the CDF, classification
probabilities of underlying theoretical distributions and their parameters,
information entropy, and skewness. Entropy changes, providing an "arrow of
time", determine dynamic trajectories along representations of distributions on
the latent space. In addition, post beta-VAE unsupervised segmentation of the
latent space based on weight-of-evidence (WOE) of posterior versus standard
isotopic two-dimensional normal densities has been applied detecting the
presence of assignable causes that distinguish exceptional CDF inputs.
- Abstract(参考訳): 分布は基本的な統計的要素であり、理論的および実践的な役割を担っている。
本稿では、単変量的経験分布を分類し、累積分布関数(CDF)の入力に基づいて2次元潜在空間を歪曲させるニューラルネットワークのトレーニング経験について述べる。
潜在空間表現は教師なしのベータ変分オートエンコーダ(beta-vae)を用いて行われている。
類似した形状を重ね合わせながら異なる形状の分布を分離し、理論的に知られている分布間の関係を経験的に実現する。
単変量連続および離散(ベルヌーリ)分布の様々な試料サイズとパラメータによる合成実験を行い,本研究を支援した。
潜在2次元座標系上の表現は、CDFの形状、基礎となる理論分布とそのパラメータの分類確率、情報エントロピー、歪みなど、重要な分布特性を乱す実世界のデータの付加メタデータと見なすことができる。
エントロピーの変化は「時間の幅」を提供し、潜在空間上の分布の表現に沿った動的な軌跡を決定する。
さらに, 後部および標準等方性2次元正規密度の重み付け(WOE)に基づく潜伏空間のβ-VAE非教師セグメンテーションを適用し, 例外CDF入力を区別するアサイン可能な原因の存在を検出する。
関連論文リスト
- Hessian-Informed Flow Matching [4.542719108171107]
Hessian-Informed Flow Matchingは、エネルギー関数のHessianを条件流に統合する新しいアプローチである。
この積分により、HI-FMは局所曲率と異方性共分散構造を考慮できる。
MNIST と Lennard-Jones 粒子のデータセットに関する実証的な評価は、HI-FM が試験サンプルの可能性を改善していることを示している。
論文 参考訳(メタデータ) (2024-10-15T09:34:52Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian
Mixture Models [59.331993845831946]
拡散モデルは、所望の特性に向けてサンプル生成を操るために、スコア関数にタスク固有の情報を注入することの恩恵を受ける。
本稿では,ガウス混合モデルの文脈における拡散モデルに対する誘導の影響を理解するための最初の理論的研究を提供する。
論文 参考訳(メタデータ) (2024-03-03T23:15:48Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Flexible Amortized Variational Inference in qBOLD MRI [56.4324135502282]
データから酸素抽出率(OEF)と脱酸素血液量(DBV)をより明瞭に決定する。
既存の推論手法では、DBVを過大評価しながら非常にノイズの多い、過小評価されたEFマップが得られる傾向にある。
本研究は, OEFとDBVの可算分布を推定できる確率論的機械学習手法について述べる。
論文 参考訳(メタデータ) (2022-03-11T10:47:16Z) - Structure-preserving GANs [6.438897276587413]
分散学習のためのデータ効率フレームワークとして,構造保存型GANを導入する。
我々は、不変判別器空間上のその射影に対して、判別器空間を減少させることができることを示す。
固有群対称性を持つ分布に対する対称性保存GANを構築することで、我々の枠組みを文脈化する。
論文 参考訳(メタデータ) (2022-02-02T16:40:04Z) - Cycle Consistent Probability Divergences Across Different Spaces [38.43511529063335]
確率分布の相違は、統計的推測と機械学習の核心にある。
本研究は, 異方性, 異方性, 異方性, 異なる空間上の分布をマッチングするための, アンバランスなモンジュ最適輸送定式化を提案する。
論文 参考訳(メタデータ) (2021-11-22T16:35:58Z) - Instrumental Variable-Driven Domain Generalization with Unobserved
Confounders [53.735614014067394]
ドメイン一般化(Domain Generalization, DG)は、複数のソースドメインから、目に見えないターゲットドメインをうまく一般化できるモデルを学ぶことを目的としている。
観測不能な共同創設者のバイアスを2段階学習で除去し,インストゥルメンタル変数駆動型DG法(IV-DG)を提案する。
第1段階では、あるドメインの入力特徴の条件分布を他のドメインの入力特徴の条件分布として学習する。
第2段階では,ラベルと学習条件分布の関係を推定する。
論文 参考訳(メタデータ) (2021-10-04T13:32:57Z) - Inverse Estimation of Elastic Modulus Using Physics-Informed Generative
Adversarial Networks [0.0]
Agenerative Adversarial Network (GAN) は偏微分方程式(PDE)の形で物理法則を符号化する
本研究では, PI-GANを機械的試験における弾性率推定に適用した。
2つのフィードフォワードディープニューラルネットワークジェネレータは、2次元領域にわたる変形と材料硬さをモデル化するために使用される。
論文 参考訳(メタデータ) (2020-05-20T20:14:10Z) - Few-shot Domain Adaptation by Causal Mechanism Transfer [107.08605582020866]
我々は,少数のラベル付き対象ドメインデータと多数のラベル付きソースドメインデータしか利用できないレグレッション問題に対して,数ショットの教師付きドメイン適応(DA)について検討する。
現在のDA法の多くは、パラメータ化された分布シフトまたは明らかな分布類似性に基づく転送仮定に基づいている。
本稿では,データ生成機構がドメイン間で不変であるメタ分散シナリオであるメカニズム転送を提案する。
論文 参考訳(メタデータ) (2020-02-10T02:16:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。