論文の概要: MESS: Manifold Embedding Motivated Super Sampling
- arxiv url: http://arxiv.org/abs/2107.06566v1
- Date: Wed, 14 Jul 2021 09:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-15 14:28:48.068733
- Title: MESS: Manifold Embedding Motivated Super Sampling
- Title(参考訳): mess: マニホールド埋め込みによる超サンプリング
- Authors: Erik Thordsen and Erich Schubert
- Abstract要約: 本研究では,データ内の観測可能な多様体の下の近似埋め込み関数に忠実な仮想データポイントを生成するフレームワークを提案する。
データセットの本質的な次元性を高めるために、要求されるデータ密度は、非常に大きなデータセットの必要性をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many approaches in the field of machine learning and data analysis rely on
the assumption that the observed data lies on lower-dimensional manifolds. This
assumption has been verified empirically for many real data sets. To make use
of this manifold assumption one generally requires the manifold to be locally
sampled to a certain density such that features of the manifold can be
observed. However, for increasing intrinsic dimensionality of a data set the
required data density introduces the need for very large data sets, resulting
in one of the many faces of the curse of dimensionality. To combat the
increased requirement for local data density we propose a framework to generate
virtual data points that faithful to an approximate embedding function
underlying the manifold observable in the data.
- Abstract(参考訳): 機械学習とデータ分析の分野における多くのアプローチは、観測されたデータが低次元多様体上にあるという仮定に依存している。
この仮定は多くの実際のデータセットで実証的に検証されている。
この多様体の仮定を利用するには、一般に多様体の特徴を観察できるような特定の密度に局所的に標本化する必要がある。
しかし、データセットの固有の次元性を高めるために、必要なデータ密度は、非常に大きなデータセットの必要性をもたらし、結果として、次元の呪いの多くの面の1つとなる。
局所データ密度の増大に対応するために,データ内の可観測多様体の基礎となる近似埋め込み関数に忠実な仮想データポイントを生成する枠組みを提案する。
関連論文リスト
- Datacube segmentation via Deep Spectral Clustering [80.32085982862151]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Manifold Learning with Sparse Regularised Optimal Transport [0.17205106391379024]
実世界のデータセットはノイズの多い観測とサンプリングを受けており、基礎となる多様体に関する情報を蒸留することが大きな課題である。
本稿では,2次正規化を用いた最適輸送の対称版を利用する多様体学習法を提案する。
得られたカーネルは連続的な極限においてLaplace型演算子と整合性を証明し、ヘテロスケダスティックノイズに対する堅牢性を確立し、これらの結果をシミュレーションで示す。
論文 参考訳(メタデータ) (2023-07-19T08:05:46Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Convolutional Filtering on Sampled Manifolds [122.06927400759021]
サンプル多様体上の畳み込みフィルタリングは連続多様体フィルタリングに収束することを示す。
本研究は,ナビゲーション制御の問題点を実証的に明らかにした。
論文 参考訳(メタデータ) (2022-11-20T19:09:50Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - A geometric framework for outlier detection in high-dimensional data [0.0]
異常検出はデータ分析において重要な課題である。
データセットのメトリック構造を利用するフレームワークを提供する。
この構造を利用することで,高次元データにおける外部観測の検出が大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-07-01T12:07:51Z) - Data-Efficient Learning via Minimizing Hyperspherical Energy [48.47217827782576]
本稿では,少数の代表データを用いたスクラッチからのデータ効率学習の問題について考察する。
我々は,MHEに基づくアクティブラーニング(MHEAL)アルゴリズムを提案し,MHEALの包括的な理論的保証を提供する。
論文 参考訳(メタデータ) (2022-06-30T11:39:12Z) - A graph representation based on fluid diffusion model for multimodal
data analysis: theoretical aspects and enhanced community detection [14.601444144225875]
流体拡散に基づくグラフ定義の新しいモデルを提案する。
本手法は,マルチモーダルデータ解析において,コミュニティ検出のための最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-12-07T16:30:03Z) - Flow Based Models For Manifold Data [11.344428134774475]
フローベース生成モデルは一般に、観測空間と同一の次元を持つ潜在空間を定義する。
多くの問題において、データはそれらが常駐する全周囲データ空間を浮き彫りにせず、むしろ低次元多様体である。
サンプル生成と表現品質の両方に利益をもたらす多様体を事前に学習することを提案する。
論文 参考訳(メタデータ) (2021-09-29T06:48:01Z) - Manifold Density Estimation via Generalized Dequantization [9.090451761951101]
ある種のデータは、その基礎となる幾何学がユークリッドであると仮定してよくモデル化されていない。
例えば、ある種のデータは球面上に存在することが知られているかもしれない。
そこで我々は,周辺ユークリッド空間の座標変換を通じて解釈する「量子化」に関する文献に触発された手法を提案する。
論文 参考訳(メタデータ) (2021-02-14T12:40:41Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。