論文の概要: Rotation-Invariant Autoencoders for Signals on Spheres
- arxiv url: http://arxiv.org/abs/2012.04474v1
- Date: Tue, 8 Dec 2020 15:15:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:43:26.296417
- Title: Rotation-Invariant Autoencoders for Signals on Spheres
- Title(参考訳): 球上の信号の回転不変オートエンコーダ
- Authors: Suhas Lohit, Shubhendu Trivedi
- Abstract要約: 球面画像に対する回転不変表現の教師なし学習の問題について検討する。
特に、$S2$と$SO(3)$の畳み込み層からなるオートエンコーダアーキテクチャを設計する。
複数のデータセットの実験は、クラスタリング、検索、分類アプリケーションにおける学習された表現の有用性を示す。
- 参考スコア(独自算出の注目度): 10.406659081400354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Omnidirectional images and spherical representations of $3D$ shapes cannot be
processed with conventional 2D convolutional neural networks (CNNs) as the
unwrapping leads to large distortion. Using fast implementations of spherical
and $SO(3)$ convolutions, researchers have recently developed deep learning
methods better suited for classifying spherical images. These newly proposed
convolutional layers naturally extend the notion of convolution to functions on
the unit sphere $S^2$ and the group of rotations $SO(3)$ and these layers are
equivariant to 3D rotations. In this paper, we consider the problem of
unsupervised learning of rotation-invariant representations for spherical
images. In particular, we carefully design an autoencoder architecture
consisting of $S^2$ and $SO(3)$ convolutional layers. As 3D rotations are often
a nuisance factor, the latent space is constrained to be exactly invariant to
these input transformations. As the rotation information is discarded in the
latent space, we craft a novel rotation-invariant loss function for training
the network. Extensive experiments on multiple datasets demonstrate the
usefulness of the learned representations on clustering, retrieval and
classification applications.
- Abstract(参考訳): 通常の2次元畳み込みニューラルネットワーク(CNN)では,3Dの形状の全体像や球面表現は処理できない。
球面とSO(3)$の畳み込みを高速に実装した研究者は、最近、球面画像の分類に適したディープラーニング手法を開発した。
これらの新しく提案された畳み込み層は、単位球面 $s^2$ と回転群 $so(3)$ への畳み込みの概念を自然に拡張し、3次元回転に同値である。
本稿では,球面画像に対する回転不変表現の教師なし学習の問題について考察する。
特に,$S^2$と$SO(3)$の畳み込み層からなるオートエンコーダアーキテクチャを慎重に設計する。
3次元回転はしばしばニュアンス因子であるため、潜在空間はこれらの入力変換に正確に不変であると制約される。
回転情報が潜在空間に捨てられるため、ネットワークをトレーニングするための新たな回転不変損失関数を構築する。
複数のデータセットに関する広範な実験は、クラスタリング、検索、分類アプリケーションにおける学習表現の有用性を示している。
関連論文リスト
- Category-Level 6D Object Pose Estimation with Flexible Vector-Based
Rotation Representation [51.67545893892129]
モノクロRGB-D画像からカテゴリレベルの6次元ポーズとサイズ推定のための新しい3次元グラフ畳み込みに基づくパイプラインを提案する。
まず,3次元グラフ畳み込みを用いた向き対応オートエンコーダの設計を行った。
そして, 回転情報を潜在特徴から効率的に復号化するために, フレキシブルなベクトルベースデコンポーザブルな回転表現を設計する。
論文 参考訳(メタデータ) (2022-12-09T02:13:43Z) - TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis [19.322295753674844]
我々は3次元回転と反射、すなわちO(3)作用の下で学習可能な記述子不変量を示す。
本研究では, 3次元球面ニューロンを4次元ベクトルニューロンに埋め込み, モデルのエンドツーエンドトレーニングを活用することを提案する。
以上の結果から,3次元ユークリッド空間で学習する3次元球状ニューロンの実用的価値が明らかとなった。
論文 参考訳(メタデータ) (2022-11-26T02:15:35Z) - Approximate Equivariance SO(3) Needlet Convolution [3.1050801937854504]
本稿では,回転群SO(3)に対する回転不変なフレッシュレット畳み込み法を開発し,球面信号のマルチスケール情報を蒸留する。
このネットワークは、球面信号の幾何学的不変の特徴を抽出する強力なツールを確立する。
NESは、量子化学レグレッションと宇宙マイクロ波背景(CMB)復調のための最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-06-17T17:21:56Z) - VNT-Net: Rotational Invariant Vector Neuron Transformers [3.04585143845864]
本稿では,最近導入されたベクトルニューロンと自己注意層を組み合わせた回転不変ニューラルネットワークを提案する。
実験により、我々のネットワークは任意のポーズで3Dポイントのクラウドオブジェクトを効率的に処理することを示した。
論文 参考訳(メタデータ) (2022-05-19T16:51:56Z) - 3D Equivariant Graph Implicit Functions [51.5559264447605]
局所的詳細のモデリングを容易にする同変層を持つグラフ暗黙関数の新しいファミリを導入する。
提案手法は,ShapeNet再構成作業において既存の回転同変暗黙関数を0.69から0.89に改善する。
論文 参考訳(メタデータ) (2022-03-31T16:51:25Z) - Rotation Equivariant 3D Hand Mesh Generation from a Single RGB Image [1.8692254863855962]
2次元RGB画像から3次元手メッシュを生成する回転同変モデルを開発した。
これにより、手入力画像が回転されると、生成されたメッシュが対応する回転を行うことが保証される。
論文 参考訳(メタデータ) (2021-11-25T11:07:27Z) - Concentric Spherical GNN for 3D Representation Learning [53.45704095146161]
同心球面特徴写像を学習するための新しい多解畳み込みアーキテクチャを提案する。
当社の階層的アーキテクチャは、球内情報と球間情報の両方を組み込むための代替学習に基づいています。
回転データを用いた3次元分類作業における最先端性能向上へのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-03-18T19:05:04Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - Rotation-Invariant Point Convolution With Multiple Equivariant
Alignments [1.0152838128195467]
回転同変アライメントを用いることで、任意の畳み込み層を回転不変にすることができることを示す。
このコア層では、オブジェクト分類とセマンティックセグメンテーションの両方における最先端の結果を改善する回転不変アーキテクチャを設計します。
論文 参考訳(メタデータ) (2020-12-07T20:47:46Z) - Spin-Weighted Spherical CNNs [58.013031812072356]
球面領域を離れることなく, 異方性フィルタを効率的に行うことができる新しい球面CNNを提案する。
鍵となる考え方は、重力波の研究において物理学で導入されたスピン重み付き球面関数を考えることである。
本手法は, 球面画像の分類, 3次元形状の分類, 球面パノラマのセマンティックセグメンテーションといったタスクにおいて, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T17:57:21Z) - A Rotation-Invariant Framework for Deep Point Cloud Analysis [132.91915346157018]
ネットワーク入力時に一般的な3次元カルト座標を置き換えるために,新しい低レベル純粋回転不変表現を導入する。
また,これらの表現を特徴に組み込むネットワークアーキテクチャを提案し,点とその近傍の局所的関係とグローバルな形状構造を符号化する。
本手法は, 形状分類, 部分分割, 形状検索を含む多点雲解析タスクにおいて評価する。
論文 参考訳(メタデータ) (2020-03-16T14:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。