論文の概要: Holographic-(V)AE: an end-to-end SO(3)-Equivariant (Variational)
Autoencoder in Fourier Space
- arxiv url: http://arxiv.org/abs/2209.15567v2
- Date: Mon, 12 Jun 2023 03:54:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 02:29:22.575854
- Title: Holographic-(V)AE: an end-to-end SO(3)-Equivariant (Variational)
Autoencoder in Fourier Space
- Title(参考訳): ホログラフィ(V)AE:フーリエ空間におけるSO(3)-同変(可変)オートエンコーダ
- Authors: Gian Marco Visani, Michael N. Pun, Arman Angaji, Armita Nourmohammad
- Abstract要約: グループ同変ニューラルネットワークは、分類と回帰タスクを解決するためのデータ効率のよいアプローチとして登場した。
本稿では,Fourier空間におけるホログラフィックオートエンコーダについて述べる。
学習した潜在空間は、球面画像の分類的特徴を効率的に符号化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Group-equivariant neural networks have emerged as a data-efficient approach
to solve classification and regression tasks, while respecting the relevant
symmetries of the data. However, little work has been done to extend this
paradigm to the unsupervised and generative domains. Here, we present
Holographic-(Variational) Auto Encoder (H-(V)AE), a fully end-to-end
SO(3)-equivariant (variational) autoencoder in Fourier space, suitable for
unsupervised learning and generation of data distributed around a specified
origin in 3D. H-(V)AE is trained to reconstruct the spherical Fourier encoding
of data, learning in the process a low-dimensional representation of the data
(i.e., a latent space) with a maximally informative rotationally invariant
embedding alongside an equivariant frame describing the orientation of the
data. We extensively test the performance of H-(V)AE on diverse datasets. We
show that the learned latent space efficiently encodes the categorical features
of spherical images. Moreover, H-(V)AE's latent space can be used to extract
compact embeddings for protein structure microenvironments, and when paired
with a Random Forest Regressor, it enables state-of-the-art predictions of
protein-ligand binding affinity.
- Abstract(参考訳): グループ同変ニューラルネットワークは、データの関連する対称性を尊重しながら、分類と回帰タスクを解決するためのデータ効率のアプローチとして登場した。
しかし、このパラダイムを教師なしかつジェネレーティブなドメインに拡張する作業はほとんど行われていない。
本稿では,Fourier空間における完全エンドツーエンドSO(3)-同変(変分)オートエンコーダであるホログラフィック自動エンコーダ(H-(V)AE)について述べる。
h-(v)ae はデータの球面フーリエ符号化を再構築するために訓練され、データの向きを表す同変フレームと共に最大に有意な回転不変な埋め込みを持つデータ(すなわち潜空間)の低次元表現をプロセスで学習する。
多様なデータセット上でH-(V)AEの性能を広範囲に検証する。
学習した潜在空間は球面画像の分類的特徴を効率的に符号化する。
さらに、H-(V)AEの潜伏空間は、タンパク質構造マイクロ環境のためのコンパクトな埋め込みを抽出し、ランダムフォレスト回帰器と組み合わせると、タンパク質-リガンド結合親和性の最先端の予測を可能にする。
関連論文リスト
- Efficient Continuous Group Convolutions for Local SE(3) Equivariance in 3D Point Clouds [5.659343611352998]
ポイントクラウド処理のための効率的で連続的で局所的なSE(3)同変畳み込み層を提案する。
提案手法は,オブジェクト分類やセマンティックセグメンテーションなど,さまざまなデータセットやタスクの競合や優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-02-11T12:15:56Z) - DiffFormer: a Differential Spatial-Spectral Transformer for Hyperspectral Image Classification [3.271106943956333]
超スペクトル画像分類(HSIC)は、高次元データをスペクトル情報と空間情報で分析する可能性から注目されている。
本稿では、スペクトル冗長性や空間不連続性といったHSICの固有の課題に対処するために、差分空間スペクトル変換器(DiffFormer)を提案する。
ベンチマークハイパースペクトルデータセットの実験は、分類精度、計算効率、一般化可能性の観点から、DiffFormerの優位性を示す。
論文 参考訳(メタデータ) (2024-12-23T07:21:41Z) - 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - Improved Cryo-EM Pose Estimation and 3D Classification through Latent-Space Disentanglement [14.973360669658561]
本稿では,自己教師付き変分オートエンコーダアーキテクチャであるHetACUMNを提案する。
シミュレーションデータセットの結果,HetACUMNは,他のアモータイズ法や非アモータイズ法よりも正確なコンフォメーション分類が得られた。
論文 参考訳(メタデータ) (2023-08-09T13:41:30Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Score-based Diffusion Models in Function Space [137.70916238028306]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
この研究は、関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)と呼ばれる数学的に厳密なフレームワークを導入する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - RENs: Relevance Encoding Networks [0.0]
本稿では,遅延空間に先行する自動相対性決定(ARD)を用いて,データ固有のボトルネック次元を学習する新しい確率的VOEベースのフレームワークであるrelevance encoding network (RENs)を提案する。
提案モデルは,サンプルの表現や生成品質を損なうことなく,関連性のあるボトルネック次元を学習することを示す。
論文 参考訳(メタデータ) (2022-05-25T21:53:48Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Spatial Information Guided Convolution for Real-Time RGBD Semantic
Segmentation [79.78416804260668]
本稿では,効率的なRGB機能と3次元空間情報統合を実現するための空間情報ガイドコンボリューション(S-Conv)を提案する。
S-Convは、3次元空間情報によって導かれる畳み込みカーネルのサンプリングオフセットを推測する能力を有する。
我々はさらにS-Convを空間情報ガイド畳み込みネットワーク(SGNet)と呼ばれるセグメンテーションネットワークに組み込みます。
論文 参考訳(メタデータ) (2020-04-09T13:38:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。