論文の概要: Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization
- arxiv url: http://arxiv.org/abs/2206.03860v1
- Date: Wed, 8 Jun 2022 12:56:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-09 13:53:02.929111
- Title: Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization
- Title(参考訳): 回転に基づく反復ガウス化のための正規直交畳み込み
- Authors: Valero Laparra, Alexander Hepburn, J. Emmanuel Johnson, Jes\'us Malo
- Abstract要約: 本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGの回転は主成分分析や独立成分分析に基づくため、画像では小さな画像パッチや孤立画素に制限されている。
emphConvolutional RBIG:この問題を緩和する拡張として,RBIGの回転が畳み込みであることを示す。
- 参考スコア(独自算出の注目度): 64.44661342486434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we elaborate an extension of rotation-based iterative
Gaussianization, RBIG, which makes image Gaussianization possible. Although
RBIG has been successfully applied to many tasks, it is limited to medium
dimensionality data (on the order of a thousand dimensions). In images its
application has been restricted to small image patches or isolated pixels,
because rotation in RBIG is based on principal or independent component
analysis and these transformations are difficult to learn and scale. Here we
present the \emph{Convolutional RBIG}: an extension that alleviates this issue
by imposing that the rotation in RBIG is a convolution. We propose to learn
convolutional rotations (i.e. orthonormal convolutions) by optimising for the
reconstruction loss between the input and an approximate inverse of the
transformation using the transposed convolution operation. Additionally, we
suggest different regularizers in learning these orthonormal convolutions. For
example, imposing sparsity in the activations leads to a transformation that
extends convolutional independent component analysis to multilayer
architectures. We also highlight how statistical properties of the data, such
as multivariate mutual information, can be obtained from \emph{Convolutional
RBIG}. We illustrate the behavior of the transform with a simple example of
texture synthesis, and analyze its properties by visualizing the stimuli that
maximize the response in certain feature and layer.
- Abstract(参考訳): 本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGは多くのタスクにうまく適用されているが、(1000次元の順序で)中次元のデータに限られている。
RBIGの回転は主成分分析や独立成分分析に基づいており、これらの変換は学習とスケールが難しいため、画像の小さなパッチや孤立画素に制限されている。
ここでは、RBIG の回転が畳み込みであることを示すことによってこの問題を緩和する拡張である \emph{Convolutional RBIG} を示す。
本稿では,変換操作を用いて入力と近似逆変換の再構成損失を最適化することにより,畳み込み回転(正規直交畳み込み)を学習することを提案する。
さらに、これらの正規直交畳み込みを学ぶ際に異なる正規化子を提案する。
例えば、アクティベーションにスパーシリティを課すことは、畳み込み独立コンポーネント分析を多層アーキテクチャに拡張する変換につながる。
また,多変量相互情報などのデータの統計特性が,emph{convolutional rbig} からどのように得られるかを強調する。
テクスチャ合成の簡単な例で変換の挙動を説明し,その特性をある特徴や層における応答を最大化する刺激を可視化することによって解析する。
関連論文リスト
- MGAug: Multimodal Geometric Augmentation in Latent Spaces of Image
Deformations [2.711740183729759]
本稿では,幾何変形の多モード潜在空間における拡張変換を生成する新しいモデルを提案する。
実験結果から,提案手法は予測精度を大幅に向上させることで,全てのベースラインよりも優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-12-20T21:30:55Z) - Deep Neural Networks with Efficient Guaranteed Invariances [77.99182201815763]
我々は、性能改善の問題、特にディープニューラルネットワークのサンプル複雑性に対処する。
群同変畳み込みは同変表現を得るための一般的なアプローチである。
本稿では,各ストリームが異なる変換に不変なマルチストリームアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-03-02T20:44:45Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - Dual-Octave Convolution for Accelerated Parallel MR Image Reconstruction [75.35200719645283]
本稿では,実物と虚構の両方から,多次元空間周波数特徴を学習可能なDual-Octave Convolution(Dual-OctConv)を提案する。
オクターブ畳み込みによる複雑な操作を改質することで、MR画像のよりリッチな表現を捉える強力な能力を示す。
論文 参考訳(メタデータ) (2021-04-12T10:51:05Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - Learnable Gabor modulated complex-valued networks for orientation
robustness [4.024850952459758]
学習可能な Gabor Convolutional Networks (LGCNs) はパラメータ効率が良く、モデルの複雑さが増す。
複雑な値を持つ畳み込み重みの束縛性について,学習したガボルフィルタを用いて検討し,配向変換を実現する。
論文 参考訳(メタデータ) (2020-11-23T21:22:27Z) - Rotated Ring, Radial and Depth Wise Separable Radial Convolutions [13.481518628796692]
本研究では、トレーニング可能な回転不変畳み込みとネットの構築について述べる。
一方、我々のアプローチは異なるモデルと異なる公開データセットに対して回転不変であることを示す。
提示される回転適応畳み込みモデルは、通常の畳み込みモデルよりも計算集約的である。
論文 参考訳(メタデータ) (2020-10-02T09:01:51Z) - Deeply Learned Spectral Total Variation Decomposition [8.679020335206753]
非線形スペクトル分解のニューラルネットワーク近似を提案する。
我々は、メガピクセルサイズの画像の処理において最大4桁(時間1万ドル)のスピードアップを報告した。
論文 参考訳(メタデータ) (2020-06-17T17:10:43Z) - Region adaptive graph fourier transform for 3d point clouds [51.193111325231165]
本稿では,3次元点雲特性の圧縮のための領域適応グラフフーリエ変換(RA-GFT)を提案する。
RA-GFTは従来の手法よりも複雑性と性能のトレードオフが優れている。
論文 参考訳(メタデータ) (2020-03-04T02:47:44Z) - Generalizing Convolutional Neural Networks for Equivariance to Lie
Groups on Arbitrary Continuous Data [52.78581260260455]
任意の特定のリー群からの変換に同値な畳み込み層を構築するための一般的な方法を提案する。
同じモデルアーキテクチャを画像、ボール・アンド・スティック分子データ、ハミルトン力学系に適用する。
論文 参考訳(メタデータ) (2020-02-25T17:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。