論文の概要: Information loss from dimensionality reduction in 5D-Gaussian spectral
data
- arxiv url: http://arxiv.org/abs/2301.11923v1
- Date: Sun, 22 Jan 2023 14:51:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-05 04:26:57.613081
- Title: Information loss from dimensionality reduction in 5D-Gaussian spectral
data
- Title(参考訳): 5次元ガウススペクトルデータにおける次元減少による情報損失
- Authors: A. Schelle and H. L\"uling
- Abstract要約: 本研究では, サンプルサイズを持つ小データセットのパラメータ範囲において, 次元減少から得られる情報の相対的損失が, 数百個のデータサンプルの順に1%未満であることを示す。
また,アントロピー確率分布の密度と期待値は,ランダムサンプリングモンテカルロシミュレーション法から得られた人工データモデルを用いて,サンプル数とサンプルサイズとともに増加すると結論づけた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Understanding the loss of information in spectral analytics is a crucial
first step towards finding root causes for failures and uncertainties using
spectral data in artificial intelligence models built from modern complex data
science applications. Here, we show from a very simple entropy model analysis
with quantum statistics of spectral data, that the relative loss of information
from dimensionality reduction due to projection of an initial five-dimensional
state onto two-dimensional diagrams is less than one percent in the parameter
range of small data sets with sample sizes on the order of few hundreds data
samples. From our analysis, we also conclude that the density and expectation
value of the entropy probability distribution increases with the sample number
and sample size using artificial data models derived from random sampling
Monte-Carlo simulation methods.
- Abstract(参考訳): スペクトル分析における情報の損失を理解することは、現代の複雑なデータサイエンスアプリケーションから構築された人工知能モデルにおいて、スペクトルデータを用いた失敗や不確実性の根本原因を見つけるための重要な第一歩である。
ここでは、スペクトルデータの量子統計を用いた非常に単純なエントロピーモデル解析から、初期5次元状態の2次元図への投影による次元減少からの情報の相対的損失は、数百個のデータサンプルの順にサンプルサイズを持つ小さなデータセットのパラメータ範囲において1%未満であることを示す。
また, ランダムサンプリングモンテカルロシミュレーション法から得られた人工データモデルを用いて, エントロピー確率分布の密度と期待値は, サンプル数とサンプルサイズに応じて増加することがわかった。
関連論文リスト
- Unified Convergence Analysis for Score-Based Diffusion Models with Deterministic Samplers [49.1574468325115]
決定論的サンプリングのための統合収束分析フレームワークを提案する。
我々のフレームワークは$tilde O(d2/epsilon)$の反復複雑性を実現する。
また,Denoising Implicit Diffusion Models (DDIM) タイプのサンプルについて詳細な分析を行った。
論文 参考訳(メタデータ) (2024-10-18T07:37:36Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Addressing Data Scarcity in Optical Matrix Multiplier Modeling Using
Transfer Learning [0.0]
本稿では,データ不足に対処するためにトランスファーラーニング(transfer learning)を用いて実験的検討を行った。
提案手法では,より精度の低い解析モデルから生成された合成データを用いて,モデルの事前学習を行う。
3x3フォトニックチップで実装された行列重みに対する1dBのルート平均二乗誤差を、利用可能なデータの25%だけを用いて達成する。
論文 参考訳(メタデータ) (2023-08-10T07:33:00Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Mathematical analysis of singularities in the diffusion model under the
submanifold assumption [0.0]
DDPMにおける解析的平均ドリフト関数とSGMにおけるスコア関数が特異データ分布のサンプリングプロセスの最終段階に爆発的に現れることを示す。
我々は新たな目標関数と関連する損失を導出するが、これは特異データ分布においても有界である。
論文 参考訳(メタデータ) (2023-01-19T05:13:03Z) - Robust learning of data anomalies with analytically-solvable entropic
outlier sparsification [0.0]
Outlier Sparsification (EOS) はデータ異常検出のための堅牢な計算戦略として提案されている。
EOSの性能は、合成問題や、バイオメディシンからの部分的に分類された分類問題において、一般的に使用される様々なツールと比較される。
論文 参考訳(メタデータ) (2021-12-22T10:13:29Z) - Low-rank statistical finite elements for scalable model-data synthesis [0.8602553195689513]
statFEMは、支配方程式に強制を埋め込むことによって、事前モデルの誤特定を認める。
この方法は、観測されたデータ生成過程を最小限の情報損失で再構築する。
本稿では、下層の密度共分散行列の低ランク近似を埋め込むことで、このハードルを克服する。
論文 参考訳(メタデータ) (2021-09-10T09:51:43Z) - Diverse Sample Generation: Pushing the Limit of Data-free Quantization [85.95032037447454]
本稿では,データ不要なポストトレーニング量子化と量子化学習のための汎用的な2次サンプル生成手法を提案する。
大規模な画像分類タスクでは、DSGは既存のデータ自由量子化手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-09-01T07:06:44Z) - Scalable Statistical Inference of Photometric Redshift via Data
Subsampling [0.3222802562733786]
ビッグデータの処理は、従来の統計モデルでは大きなボトルネックとなっている。
統計モデルのアンサンブルからの不確実性を結合したデータ駆動統計モデリングフレームワークを開発する。
この手法を宇宙論における光度赤方位推定問題で実証する。
論文 参考訳(メタデータ) (2021-03-30T02:49:50Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。