論文の概要: MESS: Manifold Embedding Motivated Super Sampling
- arxiv url: http://arxiv.org/abs/2107.06566v1
- Date: Wed, 14 Jul 2021 09:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-15 14:28:48.068733
- Title: MESS: Manifold Embedding Motivated Super Sampling
- Title(参考訳): mess: マニホールド埋め込みによる超サンプリング
- Authors: Erik Thordsen and Erich Schubert
- Abstract要約: 本研究では,データ内の観測可能な多様体の下の近似埋め込み関数に忠実な仮想データポイントを生成するフレームワークを提案する。
データセットの本質的な次元性を高めるために、要求されるデータ密度は、非常に大きなデータセットの必要性をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many approaches in the field of machine learning and data analysis rely on
the assumption that the observed data lies on lower-dimensional manifolds. This
assumption has been verified empirically for many real data sets. To make use
of this manifold assumption one generally requires the manifold to be locally
sampled to a certain density such that features of the manifold can be
observed. However, for increasing intrinsic dimensionality of a data set the
required data density introduces the need for very large data sets, resulting
in one of the many faces of the curse of dimensionality. To combat the
increased requirement for local data density we propose a framework to generate
virtual data points that faithful to an approximate embedding function
underlying the manifold observable in the data.
- Abstract(参考訳): 機械学習とデータ分析の分野における多くのアプローチは、観測されたデータが低次元多様体上にあるという仮定に依存している。
この仮定は多くの実際のデータセットで実証的に検証されている。
この多様体の仮定を利用するには、一般に多様体の特徴を観察できるような特定の密度に局所的に標本化する必要がある。
しかし、データセットの固有の次元性を高めるために、必要なデータ密度は、非常に大きなデータセットの必要性をもたらし、結果として、次元の呪いの多くの面の1つとなる。
局所データ密度の増大に対応するために,データ内の可観測多様体の基礎となる近似埋め込み関数に忠実な仮想データポイントを生成する枠組みを提案する。
関連論文リスト
- Manifold Learning via Foliations and Knowledge Transfer [0.0]
分類器として訓練された深部ReLUニューラルネットワークを用いたデータ空間上の自然な幾何学的構造を提供する。
そのような葉の特異点が測度ゼロ集合に含まれており、局所正則葉は至る所に存在することを示す。
実験により、データは葉の葉と相関していることが示された。
論文 参考訳(メタデータ) (2024-09-11T16:53:53Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Manifold Learning with Sparse Regularised Optimal Transport [0.17205106391379024]
実世界のデータセットはノイズの多い観測とサンプリングを受けており、基礎となる多様体に関する情報を蒸留することが大きな課題である。
本稿では,2次正規化を用いた最適輸送の対称版を利用する多様体学習法を提案する。
得られたカーネルは連続的な極限においてLaplace型演算子と整合性を証明し、ヘテロスケダスティックノイズに対する堅牢性を確立し、これらの結果をシミュレーションで示す。
論文 参考訳(メタデータ) (2023-07-19T08:05:46Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Convolutional Filtering on Sampled Manifolds [122.06927400759021]
サンプル多様体上の畳み込みフィルタリングは連続多様体フィルタリングに収束することを示す。
本研究は,ナビゲーション制御の問題点を実証的に明らかにした。
論文 参考訳(メタデータ) (2022-11-20T19:09:50Z) - Data-Efficient Learning via Minimizing Hyperspherical Energy [48.47217827782576]
本稿では,少数の代表データを用いたスクラッチからのデータ効率学習の問題について考察する。
我々は,MHEに基づくアクティブラーニング(MHEAL)アルゴリズムを提案し,MHEALの包括的な理論的保証を提供する。
論文 参考訳(メタデータ) (2022-06-30T11:39:12Z) - A graph representation based on fluid diffusion model for multimodal
data analysis: theoretical aspects and enhanced community detection [14.601444144225875]
流体拡散に基づくグラフ定義の新しいモデルを提案する。
本手法は,マルチモーダルデータ解析において,コミュニティ検出のための最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-12-07T16:30:03Z) - Flow Based Models For Manifold Data [11.344428134774475]
フローベース生成モデルは一般に、観測空間と同一の次元を持つ潜在空間を定義する。
多くの問題において、データはそれらが常駐する全周囲データ空間を浮き彫りにせず、むしろ低次元多様体である。
サンプル生成と表現品質の両方に利益をもたらす多様体を事前に学習することを提案する。
論文 参考訳(メタデータ) (2021-09-29T06:48:01Z) - Manifold Density Estimation via Generalized Dequantization [9.090451761951101]
ある種のデータは、その基礎となる幾何学がユークリッドであると仮定してよくモデル化されていない。
例えば、ある種のデータは球面上に存在することが知られているかもしれない。
そこで我々は,周辺ユークリッド空間の座標変換を通じて解釈する「量子化」に関する文献に触発された手法を提案する。
論文 参考訳(メタデータ) (2021-02-14T12:40:41Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。