論文の概要: MEDAL: Manifold Embedding Distillation via Autoencoder Learning
- arxiv url: http://arxiv.org/abs/2605.24244v1
- Date: Fri, 22 May 2026 21:45:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.771391
- Title: MEDAL: Manifold Embedding Distillation via Autoencoder Learning
- Title(参考訳): MEDAL:オートエンコーダ学習による人工内包蒸留
- Authors: Irene Chang, Tarek M. Zikry, Genevera I. Allen,
- Abstract要約: 低次元埋め込みは高次元データの視覚的要約として広く使われ、下流の科学的発見を可能にする。
しかし、t-SNE や UMAP などの一般的な非線形次元減少法は、視覚的魅力のみに基づいて選択されることが多い。
我々は,再利用可能なエンコーダ・デコーダモデルに適合する多様体を蒸留する新しいフレームワーク MEDAL を開発した。
- 参考スコア(独自算出の注目度): 5.046831208137848
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Low-dimensional embeddings are widely used as visual summaries of high-dimensional data and to enable downstream scientific discoveries. Yet, popular nonlinear dimension reduction methods, such as t-SNE and UMAP, are often selected based on visual appeal alone and without rigorous quantitative validation. A major reason is that manifold embeddings typically do not provide an out-of-sample map nor an inverse back to the original feature space; this makes held-out validation, the gold standard in supervised learning, all but impossible. To address these challenges, we develop a novel framework, MEDAL (Manifold Embedding Distillation via Autoencoder Learning), which distills a fitted manifold embedding into a reusable encoder--decoder model. MEDAL trains a constrained autoencoder whose bottleneck exactly matches any teacher embedding while the decoder reconstructs the original input; this yields an explicit map for new samples, an approximate inverse, and a pointwise reconstruction-based measure of distortion in the manifold space. This converts static manifold embeddings into models that can be evaluated on held-out data, enabling quantitative validation including comparing different dimension reduction methods as well as hyperparameter tuning. Across multiple benchmark and scientific case studies, we show that MEDAL enables held-out validation to determine optimal manifold embeddings and hyperparameters, reveals biologically coherent regions that are difficult to preserve in two dimensional embeddings, and detects distribution shift when new samples are mapped into a fixed reference manifold. MEDAL provides a general validation wrapper to any existing dimension reduction technique that will improve the rigor and
- Abstract(参考訳): 低次元埋め込みは高次元データの視覚的要約として広く使われ、下流の科学的発見を可能にする。
しかし、t-SNE や UMAP などの一般的な非線形次元減少法は、視覚的魅力だけで、厳密な定量的検証を行なわずに選択されることが多い。
主な理由は、多様体の埋め込みは通常、外接写像や元の特徴空間への逆戻りを提供しないからである。
これらの課題に対処するため、我々は、再利用可能なエンコーダ-デコーダモデルに適合する多様体を蒸留する新しいフレームワーク、MEDAL(Manifold Embedding Distillation via Autoencoder Learning)を開発した。
MEDALは制約付きオートエンコーダを訓練し、ボトルネックは教師の埋め込みと正確に一致し、デコーダは元の入力を再構築する。
これにより、静的な多様体の埋め込みをホールドアウトデータで評価できるモデルに変換し、異なる次元還元法の比較やハイパーパラメータチューニングを含む定量的検証を可能にする。
複数のベンチマークおよび科学的ケーススタディにおいて、MEDALは、最適多様体の埋め込みとハイパーパラメータを決定するためのホールドアウト検証を可能にし、2次元の埋め込みでは保存が難しい生物学的に一貫性のある領域を明らかにし、新しいサンプルを固定基準多様体にマッピングした場合の分布変化を検出する。
MEDALは、リガーを改良する既存の次元縮小技術に対して、一般的な検証ラッパーを提供する。
関連論文リスト
- LafitE: Latent Diffusion Model with Feature Editing for Unsupervised
Multi-class Anomaly Detection [12.596635603629725]
我々は,通常のデータのみにアクセス可能な場合に,複数のクラスに属するオブジェクトから異常を検出する統一モデルを開発した。
まず、生成的アプローチについて検討し、再構成のための潜伏拡散モデルについて検討する。
「拡散モデルの入力特徴空間を修正し、アイデンティティショートカットをさらに緩和する特徴編集戦略を導入する。」
論文 参考訳(メタデータ) (2023-07-16T14:41:22Z) - Semi-Supervised Manifold Learning with Complexity Decoupled Chart Autoencoders [45.29194877564103]
本研究は、クラスラベルなどの半教師付き情報を付加できる非対称符号化復号プロセスを備えたチャートオートエンコーダを導入する。
このようなネットワークの近似力を議論し、周囲空間の次元ではなく、本質的にデータ多様体の内在次元に依存する境界を導出する。
論文 参考訳(メタデータ) (2022-08-22T19:58:03Z) - Convergent autoencoder approximation of low bending and low distortion
manifold embeddings [5.5711773076846365]
オートエンコーダのエンコーダコンポーネントを学習するための新しい正規化を提案し,解析する。
損失関数は、入力多様体上の点対に対する異なるサンプリング戦略とモンテカルロ積分を通じて計算される。
我々の主定理は、埋め込み写像の損失汎函数をサンプリング依存損失汎函数の$Gamma$-極限として定義する。
論文 参考訳(メタデータ) (2022-08-22T10:31:31Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。