論文の概要: Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization
- arxiv url: http://arxiv.org/abs/2206.03860v1
- Date: Wed, 8 Jun 2022 12:56:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-09 13:53:02.929111
- Title: Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization
- Title(参考訳): 回転に基づく反復ガウス化のための正規直交畳み込み
- Authors: Valero Laparra, Alexander Hepburn, J. Emmanuel Johnson, Jes\'us Malo
- Abstract要約: 本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGの回転は主成分分析や独立成分分析に基づくため、画像では小さな画像パッチや孤立画素に制限されている。
emphConvolutional RBIG:この問題を緩和する拡張として,RBIGの回転が畳み込みであることを示す。
- 参考スコア(独自算出の注目度): 64.44661342486434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we elaborate an extension of rotation-based iterative
Gaussianization, RBIG, which makes image Gaussianization possible. Although
RBIG has been successfully applied to many tasks, it is limited to medium
dimensionality data (on the order of a thousand dimensions). In images its
application has been restricted to small image patches or isolated pixels,
because rotation in RBIG is based on principal or independent component
analysis and these transformations are difficult to learn and scale. Here we
present the \emph{Convolutional RBIG}: an extension that alleviates this issue
by imposing that the rotation in RBIG is a convolution. We propose to learn
convolutional rotations (i.e. orthonormal convolutions) by optimising for the
reconstruction loss between the input and an approximate inverse of the
transformation using the transposed convolution operation. Additionally, we
suggest different regularizers in learning these orthonormal convolutions. For
example, imposing sparsity in the activations leads to a transformation that
extends convolutional independent component analysis to multilayer
architectures. We also highlight how statistical properties of the data, such
as multivariate mutual information, can be obtained from \emph{Convolutional
RBIG}. We illustrate the behavior of the transform with a simple example of
texture synthesis, and analyze its properties by visualizing the stimuli that
maximize the response in certain feature and layer.
- Abstract(参考訳): 本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGは多くのタスクにうまく適用されているが、(1000次元の順序で)中次元のデータに限られている。
RBIGの回転は主成分分析や独立成分分析に基づいており、これらの変換は学習とスケールが難しいため、画像の小さなパッチや孤立画素に制限されている。
ここでは、RBIG の回転が畳み込みであることを示すことによってこの問題を緩和する拡張である \emph{Convolutional RBIG} を示す。
本稿では,変換操作を用いて入力と近似逆変換の再構成損失を最適化することにより,畳み込み回転(正規直交畳み込み)を学習することを提案する。
さらに、これらの正規直交畳み込みを学ぶ際に異なる正規化子を提案する。
例えば、アクティベーションにスパーシリティを課すことは、畳み込み独立コンポーネント分析を多層アーキテクチャに拡張する変換につながる。
また,多変量相互情報などのデータの統計特性が,emph{convolutional rbig} からどのように得られるかを強調する。
テクスチャ合成の簡単な例で変換の挙動を説明し,その特性をある特徴や層における応答を最大化する刺激を可視化することによって解析する。
関連論文リスト
- Variable-size Symmetry-based Graph Fourier Transforms for image compression [65.7352685872625]
可変サイズのグラフフーリエ変換を符号化フレームワークに導入する。
提案アルゴリズムは,ノード間の特定の対称接続を追加することにより,グリッド上の対称グラフを生成する。
実験により、SBGFTは、明示的な多重変換選択に統合された一次変換よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-24T13:00:44Z) - RLE: A Unified Perspective of Data Augmentation for Cross-Spectral Re-identification [59.5042031913258]
非線型モダリティの相違は主に、異なる材料の表面に作用する様々な線形変換に由来する。
本稿では,MRLE(Modrate Random Linear Enhancement)とRRLE(Radical Random Linear Enhancement)を含むRLE(Random Linear Enhancement)戦略を提案する。
実験結果は、RLEの優位性と有効性を示すだけでなく、クロススペクトル再同定のための汎用データ拡張としての可能性も確認した。
論文 参考訳(メタデータ) (2024-11-02T12:13:37Z) - PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views [116.10577967146762]
PixelGaussianは、任意の視点から一般化可能な3Dガウス再構成を学習するための効率的なフレームワークである。
提案手法は,様々な視点によく一般化した最先端性能を実現する。
論文 参考訳(メタデータ) (2024-10-24T17:59:58Z) - MGAug: Multimodal Geometric Augmentation in Latent Spaces of Image
Deformations [2.711740183729759]
本稿では,幾何変形の多モード潜在空間における拡張変換を生成する新しいモデルを提案する。
実験結果から,提案手法は予測精度を大幅に向上させることで,全てのベースラインよりも優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-12-20T21:30:55Z) - Dual-Octave Convolution for Accelerated Parallel MR Image Reconstruction [75.35200719645283]
本稿では,実物と虚構の両方から,多次元空間周波数特徴を学習可能なDual-Octave Convolution(Dual-OctConv)を提案する。
オクターブ畳み込みによる複雑な操作を改質することで、MR画像のよりリッチな表現を捉える強力な能力を示す。
論文 参考訳(メタデータ) (2021-04-12T10:51:05Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - Learnable Gabor modulated complex-valued networks for orientation
robustness [4.024850952459758]
学習可能な Gabor Convolutional Networks (LGCNs) はパラメータ効率が良く、モデルの複雑さが増す。
複雑な値を持つ畳み込み重みの束縛性について,学習したガボルフィルタを用いて検討し,配向変換を実現する。
論文 参考訳(メタデータ) (2020-11-23T21:22:27Z) - Rotated Ring, Radial and Depth Wise Separable Radial Convolutions [13.481518628796692]
本研究では、トレーニング可能な回転不変畳み込みとネットの構築について述べる。
一方、我々のアプローチは異なるモデルと異なる公開データセットに対して回転不変であることを示す。
提示される回転適応畳み込みモデルは、通常の畳み込みモデルよりも計算集約的である。
論文 参考訳(メタデータ) (2020-10-02T09:01:51Z) - Deeply Learned Spectral Total Variation Decomposition [8.679020335206753]
非線形スペクトル分解のニューラルネットワーク近似を提案する。
我々は、メガピクセルサイズの画像の処理において最大4桁(時間1万ドル)のスピードアップを報告した。
論文 参考訳(メタデータ) (2020-06-17T17:10:43Z) - Generalizing Convolutional Neural Networks for Equivariance to Lie
Groups on Arbitrary Continuous Data [52.78581260260455]
任意の特定のリー群からの変換に同値な畳み込み層を構築するための一般的な方法を提案する。
同じモデルアーキテクチャを画像、ボール・アンド・スティック分子データ、ハミルトン力学系に適用する。
論文 参考訳(メタデータ) (2020-02-25T17:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。