論文の概要: Geometric Autoencoders -- What You See is What You Decode
- arxiv url: http://arxiv.org/abs/2306.17638v1
- Date: Fri, 30 Jun 2023 13:24:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 12:27:22.551635
- Title: Geometric Autoencoders -- What You See is What You Decode
- Title(参考訳): 幾何学的オートエンコーダ - あなたが見る、デコードするもの
- Authors: Philipp Nazari, Sebastian Damrich, Fred A. Hamprecht
- Abstract要約: 本稿では,デコーダ上での微分幾何学的視点を提案し,埋め込みの歪みに対する洞察力のある診断と,そのような歪みを緩和する新たな正規化器を提案する。
我々のGeometric Autoencoder'は埋め込みを急激に伸ばすのを避けるので、可視化はデータ構造をより忠実に捉えます。
- 参考スコア(独自算出の注目度): 12.139222986297263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visualization is a crucial step in exploratory data analysis. One possible
approach is to train an autoencoder with low-dimensional latent space. Large
network depth and width can help unfolding the data. However, such expressive
networks can achieve low reconstruction error even when the latent
representation is distorted. To avoid such misleading visualizations, we
propose first a differential geometric perspective on the decoder, leading to
insightful diagnostics for an embedding's distortion, and second a new
regularizer mitigating such distortion. Our ``Geometric Autoencoder'' avoids
stretching the embedding spuriously, so that the visualization captures the
data structure more faithfully. It also flags areas where little distortion
could not be achieved, thus guarding against misinterpretation.
- Abstract(参考訳): 可視化は探索データ分析における重要なステップである。
考えられる1つのアプローチは、低次元の潜在空間でオートエンコーダを訓練することである。
ネットワークの深さと幅は、データの展開に役立つ。
しかし、そのような表現ネットワークは、潜在表現が歪んだ場合でも、低い再構成誤差を達成できる。
このような誤解を招く可視化を避けるために,まずデコーダ上の微分幾何的視点を提案し,埋め込みの歪みに対する洞察的な診断と,その歪みを緩和する新しい正則化器を提案する。
我々の ‘Geometric Autoencoder'' は埋め込みを飛躍的に拡張することを避け、視覚化がデータ構造をより忠実にキャプチャする。
また、歪みの少ない領域にフラグを付け、誤解釈を防げるようにした。
関連論文リスト
- Decoder Decomposition for the Analysis of the Latent Space of Nonlinear Autoencoders With Wind-Tunnel Experimental Data [3.7960472831772765]
本研究の目的は,オートエンコーダの解釈可能性向上を支援する手法を提案することである。
本稿では,遅延変数をフローのコヒーレントな構造に接続するための後処理法であるデコーダ分解を提案する。
遅延変数のランク付けと選択は、非線形オートエンコーダの設計と解釈に役立つ。
論文 参考訳(メタデータ) (2024-04-25T10:09:37Z) - Compression of Structured Data with Autoencoders: Provable Benefit of
Nonlinearities and Depth [83.15263499262824]
勾配勾配勾配は入力のスパース構造を完全に無視する解に収束することを示す。
浅層構造にデノナイジング関数を付加することにより,スパースデータの圧縮におけるガウス性能の改善方法を示す。
CIFAR-10 や MNIST などの画像データセットに対して,本研究の成果を検証した。
論文 参考訳(メタデータ) (2024-02-07T16:32:29Z) - AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation [51.143540967290114]
本研究では,教師なし深度計算と推定のために,従来不可能であった幾何拡張の幅広い範囲をアンロックする手法を提案する。
これは、出力深さの座標への幾何変換を反転、あるいはアンドウイング(undo''-ing)し、深度マップを元の参照フレームに戻すことで達成される。
論文 参考訳(メタデータ) (2023-10-15T05:15:45Z) - Adversarial robustness of VAEs through the lens of local geometry [1.2228014485474623]
可変オートエンコーダ (VAEs) に対する教師なし攻撃では、敵は入力サンプルに小さな摂動を発見し、潜時空間の符号化を著しく変化させる。
本稿では, VAEを攻撃するための最適手法として, プルバック計量テンソルの方向バイアスを利用する方法を示す。
論文 参考訳(メタデータ) (2022-08-08T05:53:57Z) - Anomaly Detection with Adversarially Learned Perturbations of Latent
Space [9.473040033926264]
異常検出は、正常なデータの分布に適合しないサンプルを特定することである。
本研究では,2つの競合するコンポーネント,Adversarial Distorter と Autoencoder で構成される対角的フレームワークを設計した。
提案手法は,画像およびビデオデータセットの異常検出において,既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-03T19:32:00Z) - Toward a Geometrical Understanding of Self-supervised Contrastive
Learning [55.83778629498769]
自己教師付き学習(SSL)は、人間のアノテーションがなければ、伝達学習に有効なデータ表現を作成するための最重要技術の一つである。
メインストリームSSL技術は、エンコーダとプロジェクタという2つのカスケードニューラルネットワークを備えた、特定のディープニューラルネットワークアーキテクチャに依存している。
本稿では,データ拡張ポリシーの強みがデータ埋め込みに与える影響について検討する。
論文 参考訳(メタデータ) (2022-05-13T23:24:48Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - A manifold learning perspective on representation learning: Learning
decoder and representations without an encoder [0.0]
オートエンコーダは表現学習で一般的に使用される。
多様体学習にインスパイアされて、トレーニングサンプルの表現を学習することで、デコーダを単独で訓練できることが示される。
デコーダのみを訓練する我々のアプローチは、小さなデータセットでも表現学習を容易にする。
論文 参考訳(メタデータ) (2021-08-31T15:08:50Z) - Learning to Recover 3D Scene Shape from a Single Image [98.20106822614392]
まず,未知のスケールまで深さを予測し,単一の単眼画像からシフトする2段階フレームワークを提案する。
そして、3dポイントクラウドエンコーダを使って深度シフトと焦点距離を予測し、リアルな3dシーンの形状を復元します。
論文 参考訳(メタデータ) (2020-12-17T02:35:13Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Isometric Autoencoders [36.947436313489746]
我々はアイソメトリ(即ち局所距離保存)正則化を提唱する。
我々の正規化器は、(つまりデコーダは等尺線、(ii)デコーダはデコーダの擬似逆、すなわち、エンコーダはプロジェクションによりデコーダの逆を周囲空間に拡張する。
論文 参考訳(メタデータ) (2020-06-16T16:31:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。