論文の概要: Manifold Decoders: A Framework for Generative Modeling from Nonlinear Embeddings
- arxiv url: http://arxiv.org/abs/2510.13622v1
- Date: Wed, 15 Oct 2025 14:50:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.718481
- Title: Manifold Decoders: A Framework for Generative Modeling from Nonlinear Embeddings
- Title(参考訳): Manifold Decoders: 非線形埋め込みから生成モデリングを行うフレームワーク
- Authors: Riddhish Thakare, Kingdom Mutala Akugri,
- Abstract要約: 著名なNLDR手法のためのニューラルデコーダアーキテクチャを構築するためのシステム・アティック・フレームワークを提案する。
このフレームワークは、これらの学習された多様体空間内で直接動作する拡散ベースの生成プロセスを実装することで拡張される。
その結果,デコーダはデータの再構築に成功しているが,その品質はエンドツーエンドの最適化されたオートエンコーダに勝っていることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classical nonlinear dimensionality reduction (NLDR) techniques like t-SNE, Isomap, and LLE excel at creating low-dimensional embeddings for data visualization but fundamentally lack the ability to map these embeddings back to the original high-dimensional space. This one-way transformation limits their use in generative applications. This paper addresses this critical gap by introducing a system- atic framework for constructing neural decoder architectures for prominent NLDR methods, enabling bidirectional mapping for the first time. We extend this framework by implementing a diffusion-based generative process that operates directly within these learned manifold spaces. Through experiments on the CelebA dataset, we evaluate the reconstruction and generative performance of our approach against autoencoder and standard diffusion model baselines. Our findings reveal a fundamental trade- off: while the decoders successfully reconstruct data, their quality is surpassed by end-to-end optimized autoencoders. Moreover, manifold-constrained diffusion yields poor-quality samples, suggesting that the discrete and sparse nature of classical NLDR embeddings is ill-suited for the continuous inter- polation required by generative models. This work highlights the inherent challenges in retrofitting generative capabilities onto NLDR methods designed primarily for visualization and analysis.
- Abstract(参考訳): t-SNE、Isomap、LLEのような古典的非線形次元減少(NLDR)技術は、データの可視化のために低次元の埋め込みを作成するのに優れているが、これらの埋め込みを元の高次元空間にマッピングする能力は基本的に欠如している。
この一方的な変換は、生成的応用においての使用を制限する。
本稿では,NLDR方式のためのニューラルデコーダアーキテクチャ構築のためのシステム・アティック・フレームワークを導入することにより,この重要なギャップを解消し,双方向マッピングを初めて実現した。
このフレームワークは、これらの学習された多様体空間内で直接動作する拡散ベースの生成プロセスを実装することで拡張される。
CelebAデータセットの実験を通じて, オートエンコーダと標準拡散モデルベースラインに対するアプローチの再構築と生成性能を評価する。
復号器はデータの再構成に成功しているが、その品質はエンドツーエンドの最適化されたオートエンコーダに勝っている。
さらに、多様体に制約された拡散は、品質の悪いサンプルをもたらすので、古典的NLDR埋め込みの離散的かつスパースな性質は、生成モデルによって要求される連続的な相互ポレーションに不適であることを示唆している。
この研究は、主に可視化と解析のために設計されたNLDR法に生成能力を適合させる際の固有の課題を強調している。
関連論文リスト
- SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation [10.77777607732642]
Spiralは、深度、反射率の画像、セマンティックマップを同時に生成する新しいレンジビューLiDAR拡散モデルである。
Semantic KITTIとnuScenesデータセットの実験は、Spralが最小のパラメータサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-28T17:55:35Z) - Intern-GS: Vision Model Guided Sparse-View 3D Gaussian Splatting [95.61137026932062]
Intern-GSはスパースビューガウススプラッティングのプロセスを強化する新しいアプローチである。
Intern-GSは多様なデータセットにまたがって最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2025-05-27T05:17:49Z) - Latent Diffusion Prior Enhanced Deep Unfolding for Snapshot Spectral Compressive Imaging [17.511583657111792]
スナップショット分光画像再構成は、単発2次元圧縮計測から3次元空間スペクトル像を再構成することを目的としている。
我々は, 深部展開法に先立って劣化のないモデルを生成するため, 遅延拡散モデル(LDM)という生成モデルを導入する。
論文 参考訳(メタデータ) (2023-11-24T04:55:20Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Low-rank Tensor Assisted K-space Generative Model for Parallel Imaging
Reconstruction [14.438899814473446]
並列画像再構成のための低ランクテンソル支援k空間生成モデル(LR-KGM)を提案する。
これは、学習のための元の事前情報を高次元の事前情報に変換することを意味する。
実験により, LR-KGM法は高い性能を示した。
論文 参考訳(メタデータ) (2022-12-11T13:34:43Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Subspace Modeling for Fast Out-Of-Distribution and Anomaly Detection [5.672132510411465]
本稿では、ディープニューラルネットワーク(DNN)における異常および分布外サンプルを検出するための原則的アプローチを提案する。
本稿では,DNN が生成する意味的特徴に対する線形統計量次元削減手法の適用を提案する。
高次元空間における原特徴と低次元縮小埋め込みの前像との差の$ell$-normの「機能再構成誤差」(FRE)はOODと異常検出に極めて有効であることを示す。
論文 参考訳(メタデータ) (2022-03-20T00:55:20Z) - The Deep Generative Decoder: MAP estimation of representations improves
modeling of single-cell RNA data [0.0]
モデルパラメータと表現を直接最大後部推定(MAP)により計算する単純な生成モデルを提案する。
このアプローチの利点は、その単純さと、同等のVAEよりもはるかに小さな次元の表現を提供する能力である。
論文 参考訳(メタデータ) (2021-10-13T12:17:46Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。