論文の概要: Scalable and Equivariant Spherical CNNs by Discrete-Continuous (DISCO)
Convolutions
- arxiv url: http://arxiv.org/abs/2209.13603v1
- Date: Tue, 27 Sep 2022 18:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 16:37:41.759029
- Title: Scalable and Equivariant Spherical CNNs by Discrete-Continuous (DISCO)
Convolutions
- Title(参考訳): 離散連続(DISCO)畳み込みによるスケーラブル・等変球面CNN
- Authors: Jeremy Ocampo, Matthew A. Price, Jason D. McEwen
- Abstract要約: 既存の球面畳み込みニューラルネットワーク(CNN)フレームワークは、計算的拡張性と回転的同変の両方である。
我々は、高分解能に対して同変かつ計算的に同値なハイブリッド離散連続群畳み込み(DISCO)を開発する。
4kの球面画像では、計算コストが109ドル、メモリ使用量が104ドルである。
- 参考スコア(独自算出の注目度): 5.8808473430456525
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: No existing spherical convolutional neural network (CNN) framework is both
computationally scalable and rotationally equivariant. Continuous approaches
capture rotational equivariance but are often prohibitively computationally
demanding. Discrete approaches offer more favorable computational performance
but at the cost of equivariance. We develop a hybrid discrete-continuous
(DISCO) group convolution that is simultaneously equivariant and
computationally scalable to high-resolution. While our framework can be applied
to any compact group, we specialize to the sphere. Our DISCO spherical
convolutions not only exhibit $\text{SO}(3)$ rotational equivariance but also a
form of asymptotic $\text{SO}(3)/\text{SO}(2)$ rotational equivariance, which
is more desirable for many applications (where $\text{SO}(n)$ is the special
orthogonal group representing rotations in $n$-dimensions). Through a sparse
tensor implementation we achieve linear scaling in number of pixels on the
sphere for both computational cost and memory usage. For 4k spherical images we
realize a saving of $10^9$ in computational cost and $10^4$ in memory usage
when compared to the most efficient alternative equivariant spherical
convolution. We apply the DISCO spherical CNN framework to a number of
benchmark dense-prediction problems on the sphere, such as semantic
segmentation and depth estimation, on all of which we achieve the
state-of-the-art performance.
- Abstract(参考訳): 既存の球面畳み込みニューラルネットワーク(cnn)フレームワークは、計算上スケーラブルかつ回転同値である。
連続的アプローチは回転同値を捕捉するが、しばしば計算的に要求される。
離散的アプローチは、より好ましい計算性能を提供するが、同値である。
我々は、同変かつ計算能力に富んだ高解像度のハイブリッド離散連続群畳み込み(DISCO)を開発する。
我々のフレームワークは任意のコンパクト群に適用できるが、球体に特化している。
私たちのディスコ球面畳み込みは、$\text{so}(3)$ rotational equivarianceを示すだけでなく、非漸近的な$\text{so}(3)/\text{so}(2)$ rotational equivarianceという形式も示しており、多くのアプリケーション($\text{so}(n)$ は$n$-dimensions における回転を表す特別な直交群である)でより望ましい。
スパーステンソル実装により,計算コストとメモリ使用量の両方において,球面上の画素数の線形スケーリングを実現する。
4k球面画像の場合、最も効率的な等価球面畳み込みに比べて計算コストが10^9$、メモリ使用量が10^4$になる。
本稿では,semantic segmentation や depth estimation といった球面上の多くのベンチマーク密予測問題に対して,最先端の性能を達成するためにdisco sphere cnn フレームワークを適用する。
関連論文リスト
- Fast, Expressive SE$(n)$ Equivariant Networks through Weight-Sharing in Position-Orientation Space [15.495593104596399]
我々は,畳み込みネットワークにおける重み共有の概念を,ポイントペア上でのメッセージ関数の共有として定式化する。
我々は3次元点雲処理のための効率的な同変群畳み込みネットワークを開発した。
論文 参考訳(メタデータ) (2023-10-04T17:06:32Z) - O$n$ Learning Deep O($n$)-Equivariant Hyperspheres [18.010317026027028]
我々は、$n$Dの反射と回転の変換の下で、深い特徴同変を学習するためのアプローチを提案する。
すなわち、任意の次元$n$に一般化する球面決定曲面を持つ O$(n)$-同変ニューロンを提案する。
我々は理論的貢献を実験的に検証し、O$(n)$-equivariantベンチマークデータセットの競合する手法よりもアプローチの方が優れていることを発見した。
論文 参考訳(メタデータ) (2023-05-24T23:04:34Z) - Equivalence Between SE(3) Equivariant Networks via Steerable Kernels and
Group Convolution [90.67482899242093]
近年, 入力の回転と変換において等価な3次元データに対して, ニューラルネットワークを設計するための幅広い手法が提案されている。
両手法とその等価性を詳細に解析し,その2つの構成をマルチビュー畳み込みネットワークに関連付ける。
また、同値原理から新しいTFN非線形性を導出し、実用的なベンチマークデータセット上でテストする。
論文 参考訳(メタデータ) (2022-11-29T03:42:11Z) - PDO-e$\text{S}^\text{2}$CNNs: Partial Differential Operator Based
Equivariant Spherical CNNs [77.53203546732664]
我々は偏微分演算子を用いて球等価CNN, PDO-e$textStext2$CNNを設計する。
実験では、pdo-e$textstext2$cnnsはパラメータ効率が高く、いくつかのタスクで他の球面cnnを大きく上回る。
論文 参考訳(メタデータ) (2021-04-08T07:54:50Z) - Rotation-Invariant Autoencoders for Signals on Spheres [10.406659081400354]
球面画像に対する回転不変表現の教師なし学習の問題について検討する。
特に、$S2$と$SO(3)$の畳み込み層からなるオートエンコーダアーキテクチャを設計する。
複数のデータセットの実験は、クラスタリング、検索、分類アプリケーションにおける学習された表現の有用性を示す。
論文 参考訳(メタデータ) (2020-12-08T15:15:03Z) - Efficient Generalized Spherical CNNs [7.819876182082904]
既存の様々なアプローチを包含し,相互に活用できる汎用球面CNNフレームワークを提案する。
これらの開発により、球面ベンチマーク問題に対する最先端の精度とパラメータ効率を実現する、より表現力のあるハイブリッドモデルの構築が可能であることが示されている。
論文 参考訳(メタデータ) (2020-10-09T18:00:05Z) - PDO-eConvs: Partial Differential Operator Based Equivariant Convolutions [71.60219086238254]
我々は、畳み込みと偏微分作用素(PDO)の接続から問題に対処する。
実装において、ほぼ同変の畳み込み(PDO-eConvs)を導出し、PDOの数値スキームを用いてシステムを識別する。
回転したMNISTと自然画像分類の実験により、PDO-eConvsは競合的に機能するが、より効率的にパラメータを使用することが示された。
論文 参考訳(メタデータ) (2020-07-20T18:57:26Z) - Spin-Weighted Spherical CNNs [58.013031812072356]
球面領域を離れることなく, 異方性フィルタを効率的に行うことができる新しい球面CNNを提案する。
鍵となる考え方は、重力波の研究において物理学で導入されたスピン重み付き球面関数を考えることである。
本手法は, 球面画像の分類, 3次元形状の分類, 球面パノラマのセマンティックセグメンテーションといったタスクにおいて, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T17:57:21Z) - Linear Time Sinkhorn Divergences using Positive Features [51.50788603386766]
エントロピー正則化で最適な輸送を解くには、ベクトルに繰り返し適用される$ntimes n$ kernel matrixを計算する必要がある。
代わりに、$c(x,y)=-logdotpvarphi(x)varphi(y)$ ここで$varphi$は、地上空間から正のorthant $RRr_+$への写像であり、$rll n$である。
論文 参考訳(メタデータ) (2020-06-12T10:21:40Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。