論文の概要: GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings
- arxiv url: http://arxiv.org/abs/2504.02819v1
- Date: Thu, 03 Apr 2025 17:58:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 12:57:29.079682
- Title: GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings
- Title(参考訳): GMR-Conv:ガウス混合リングを用いた効率的な回転と反射等価な畳み込みカーネル
- Authors: Yuexi Du, Jiazhen Zhang, Nicha C. Dvornek, John A. Onofrey,
- Abstract要約: ガウス重み付き環の混合を用いて放射対称性を滑らかにする効率的な畳み込み核を導入する。
8つの分類と1つのセグメンテーションデータセットの実験は、GMR-Convが従来のCNNのパフォーマンスにマッチするだけでなく、向きのないデータを持つアプリケーションでもそれを上回ることを示した。
- 参考スコア(独自算出の注目度): 4.365790707793824
- License:
- Abstract: Symmetry, where certain features remain invariant under geometric transformations, can often serve as a powerful prior in designing convolutional neural networks (CNNs). While conventional CNNs inherently support translational equivariance, extending this property to rotation and reflection has proven challenging, often forcing a compromise between equivariance, efficiency, and information loss. In this work, we introduce Gaussian Mixture Ring Convolution (GMR-Conv), an efficient convolution kernel that smooths radial symmetry using a mixture of Gaussian-weighted rings. This design mitigates discretization errors of circular kernels, thereby preserving robust rotation and reflection equivariance without incurring computational overhead. We further optimize both the space and speed efficiency of GMR-Conv via a novel parameterization and computation strategy, allowing larger kernels at an acceptable cost. Extensive experiments on eight classification and one segmentation datasets demonstrate that GMR-Conv not only matches conventional CNNs' performance but can also surpass it in applications with orientation-less data. GMR-Conv is also proven to be more robust and efficient than the state-of-the-art equivariant learning methods. Our work provides inspiring empirical evidence that carefully applied radial symmetry can alleviate the challenges of information loss, marking a promising advance in equivariant network architectures. The code is available at https://github.com/XYPB/GMR-Conv.
- Abstract(参考訳): 幾何変換の下で特定の特徴が不変である対称性は、畳み込みニューラルネットワーク(CNN)を設計する上で、しばしば強力な先駆的役割を果たす。
従来のCNNは本質的に翻訳的等価性をサポートしているが、この特性を回転と反射に拡張することは困難であり、しばしば等価性、効率性、情報損失の妥協を迫られる。
本研究ではガウス混合環(GMR-Conv)を導入し,ガウス重み付き環の混合を用いてラジアル対称性を滑らかにする効率的な畳み込み核について述べる。
この設計は、円核の離散化誤差を軽減し、計算オーバーヘッドを発生させることなく、ロバストな回転と反射同値を保存する。
我々はさらに,GMR-Convのパラメータ化と計算戦略により,GMR-Convの空間効率と速度効率の両面を最適化し,より大きなカーネルを許容可能なコストで実現した。
8つの分類と1つのセグメンテーションデータセットに関する大規模な実験は、GMR-Convが従来のCNNのパフォーマンスにマッチするだけでなく、向きのないデータを持つアプリケーションでもそれを超えることを示した。
GMR-Convは、最先端の同変学習法よりも堅牢で効率的であることが証明されている。
我々の研究は、入射対称性を慎重に適用することで、情報損失の課題を軽減し、同変ネットワークアーキテクチャにおける有望な進歩を示す経験的証拠を提供する。
コードはhttps://github.com/XYPB/GMR-Conv.comで入手できる。
関連論文リスト
- Improved Vessel Segmentation with Symmetric Rotation-Equivariant U-Net [4.365790707793824]
本稿では、U-Netアーキテクチャに対する効率的な対称回転同変(SRE)畳み込みカーネルの実装を提案する。
網膜血管底部イメージングにおけるセグメンテーション性能の改善により,本法の有効性を検証した。
我々の提案するSRE U-Netは、回転した画像を扱う際の標準U-Netをはるかに上回るだけでなく、既存の同変学習手法よりも優れている。
論文 参考訳(メタデータ) (2025-01-24T15:54:51Z) - SRE-Conv: Symmetric Rotation Equivariant Convolution for Biomedical Image Classification [4.2790694771618725]
畳み込みニューラルネットワーク(CNN)はコンピュータビジョンタスクに不可欠なツールであるが、それらは望ましい性質を欠いている。
SRE-Convカーネルはモデルサイズを同時に圧縮しながら回転不変の特徴を学習するように設計されている。
SRE-Conv-CNNは、2D画像と3D画像の両方で16の試験データセットの回転画像分類性能を向上した。
論文 参考訳(メタデータ) (2025-01-16T18:59:02Z) - Relaxed Rotational Equivariance via $G$-Biases in Vision [19.814324876189772]
群同変畳み込み(GConv)は、元のデータから回転同値を取ることができる。
しかし、実世界のデータの提示や分布は、しばしば厳密な回転同値に適合する。
本稿では,G$-Biasesと呼ばれる学習可能なバイアスの集合を利用して,この問題に対処する,単純かつ高効率な手法を提案する。
実験により,提案手法は既存のGConv法と比較して,2次元オブジェクト検出タスクと分類作業の両方において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-08-22T14:52:53Z) - Variance-Reducing Couplings for Random Features [57.73648780299374]
ランダム機能(RF)は、機械学習においてカーネルメソッドをスケールアップする一般的なテクニックである。
ユークリッド空間と離散入力空間の両方で定義されるRFを改善するための結合を求める。
パラダイムとしての分散還元の利点と限界について、驚くほどの結論に達した。
論文 参考訳(メタデータ) (2024-05-26T12:25:09Z) - Deep Neural Networks with Efficient Guaranteed Invariances [77.99182201815763]
我々は、性能改善の問題、特にディープニューラルネットワークのサンプル複雑性に対処する。
群同変畳み込みは同変表現を得るための一般的なアプローチである。
本稿では,各ストリームが異なる変換に不変なマルチストリームアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-03-02T20:44:45Z) - From CNNs to Shift-Invariant Twin Models Based on Complex Wavelets [7.812210699650151]
我々は第1層の組み合わせを "real-valued convolutions + max pooling" に置き換える。
我々は、CModとRMaxが、畳み込みカーネルが帯域通過で向き付けられたときに、同等の出力を生成すると主張している。
提案手法は,ImageNetとCIFAR-10の分類タスクにおいて,優れた精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T09:42:55Z) - RIC-CNN: Rotation-Invariant Coordinate Convolutional Neural Network [56.42518353373004]
回転不変座標変換(RIC-C)と呼ばれる新しい畳み込み演算を提案する。
CNNの標準畳み込み層を対応するRCC-Cに置き換えることで、RCC-CNNを導出することができる。
RIC-CNNはMNISTの回転試験データセット上で最先端の分類を実現することが観察できる。
論文 参考訳(メタデータ) (2022-11-21T19:27:02Z) - Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization [64.44661342486434]
本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGの回転は主成分分析や独立成分分析に基づくため、画像では小さな画像パッチや孤立画素に制限されている。
emphConvolutional RBIG:この問題を緩和する拡張として,RBIGの回転が畳み込みであることを示す。
論文 参考訳(メタデータ) (2022-06-08T12:56:34Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - Scalable Variational Gaussian Processes via Harmonic Kernel
Decomposition [54.07797071198249]
汎用性を維持しつつ高い忠実度近似を提供する,スケーラブルな変分ガウス過程近似を導入する。
様々な回帰問題や分類問題において,本手法は変換やリフレクションなどの入力空間対称性を活用できることを実証する。
提案手法は, 純粋なGPモデルのうち, CIFAR-10 の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-10T18:17:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。