論文の概要: SONIC: Spectral Oriented Neural Invariant Convolutions
- arxiv url: http://arxiv.org/abs/2601.19884v1
- Date: Tue, 27 Jan 2026 18:51:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.436042
- Title: SONIC: Spectral Oriented Neural Invariant Convolutions
- Title(参考訳): SONIC: スペクトル指向型ニューラル不変畳み込み
- Authors: Gijs Joppe Moens, Regina Beets-Tan, Eduardo H. P. Pooch,
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は、ローカルパッチをスキャンする固定サイズのカーネルに依存している。
ViTはグローバル接続を提供するが、空間的帰納バイアスがなく、明示的な位置エンコーディングに依存し、初期パッチサイズに結びついている。
本稿では,共振子演算子を,一組の共振子選択成分を用いてモデル化する連続スペクトルパラメータ化SONICを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional Neural Networks (CNNs) rely on fixed-size kernels scanning local patches, which limits their ability to capture global context or long-range dependencies without very deep architectures. Vision Transformers (ViTs), in turn, provide global connectivity but lack spatial inductive bias, depend on explicit positional encodings, and remain tied to the initial patch size. Bridging these limitations requires a representation that is both structured and global. We introduce SONIC (Spectral Oriented Neural Invariant Convolutions), a continuous spectral parameterisation that models convolutional operators using a small set of shared, orientation-selective components. These components define smooth responses across the full frequency domain, yielding global receptive fields and filters that adapt naturally across resolutions. Across synthetic benchmarks, large-scale image classification, and 3D medical datasets, SONIC shows improved robustness to geometric transformations, noise, and resolution shifts, and matches or exceeds convolutional, attention-based, and prior spectral architectures with an order of magnitude fewer parameters. These results demonstrate that continuous, orientation-aware spectral parameterisations provide a principled and scalable alternative to conventional spatial and spectral operators.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、ローカルパッチをスキャンする固定サイズのカーネルに依存している。
視覚変換器(ViT)は、グローバル接続を提供するが、空間的帰納バイアスがなく、明確な位置エンコーディングに依存し、初期パッチサイズに結びついている。
これらの制限をブリッジするには、構造的かつグローバルな表現が必要である。
SONIC(Spectral Oriented Neural Invariant Convolutions, スペクトル指向ニューラル不変量畳み込み)は, 共振子演算子を, 少数の共振子選択成分を用いてモデル化する連続スペクトルパラメータ化である。
これらの成分は全周波数領域にわたって滑らかな応答を定義し、大域的受容場と分解能に自然に適応するフィルタを生成する。
総合ベンチマーク、大規模画像分類、および3次元医用データセットを通じて、SONICは、幾何変換、ノイズ、分解能シフトに対する堅牢性を改善した。
これらの結果は、従来の空間的およびスペクトル的演算子に代わる、連続的、指向性を考慮したスペクトルパラメータ化が、原則的かつスケーラブルな代替手段であることを示している。
関連論文リスト
- Renormalization Group Guided Tensor Network Structure Search [58.0378300612202]
ネットワーク構造探索(TN-SS)は、高次元データ表現における効率的なテンソル分解のための最適なネットワークトポロジとランクロバスト性を自動的に発見することを目的としている。
RGTN(Renormalization Group Guided Network Search)は、TN-SSを変換する物理に着想を得たフレームワークである。
論文 参考訳(メタデータ) (2025-12-31T06:31:43Z) - Geometrically Constrained and Token-Based Probabilistic Spatial Transformers [5.437226012505534]
我々は、トランスフォーマーベースのビジョンパイプラインの標準化ツールとして、空間トランスフォーマーネットワーク(STN)を再考する。
本稿では、堅牢性を向上させる確率的、コンポーネントワイドな拡張を提案する。
本手法が他のSTNと比較して頑健さを常に向上することを示す。
論文 参考訳(メタデータ) (2025-09-14T11:30:53Z) - Sheaf Graph Neural Networks via PAC-Bayes Spectral Optimization [13.021238902084647]
グラフニューラルネットワーク(GNN)のオーバースムース化は、異なるノード機能で崩壊を引き起こす。
SGPC (Sheaf GNNs with PAC-Bayes) は,セルラーシェーフメッセージパッシングと複数のメカニズムを組み合わせた統一アーキテクチャである。
9つのホモ親和性およびヘテロ親和性ベンチマークの実験により、SGPCは最先端スペクトルおよび層ベースGNNよりも優れた性能を示した。
論文 参考訳(メタデータ) (2025-08-01T06:39:28Z) - SDTN and TRN: Adaptive Spectral-Spatial Feature Extraction for Hyperspectral Image Classification [1.2871580250533408]
ハイパースペクトル画像分類は、精密農業において重要な役割を担い、作物の健康モニタリング、病気の検出、土壌分析に関する正確な洞察を提供する。
従来の手法は高次元データ、スペクトル空間の冗長性、ラベル付きサンプルの不足に悩まされ、しばしば準最適性能に繋がる。
これらの課題に対処するために,テンソル分解と正規化機構を組み合わせた自己適応正規化ネットワーク(SDTN)を提案し,テンソルランクを動的に調整する。
このアプローチは、高い分類精度を維持するだけでなく、計算の複雑さを大幅に減らし、リソース制約のある環境でのリアルタイムデプロイメントに非常に適している。
論文 参考訳(メタデータ) (2025-07-13T04:53:33Z) - Point Cloud Denoising With Fine-Granularity Dynamic Graph Convolutional Networks [58.050130177241186]
ノイズの摂動は、しばしば3次元の点雲を破損させ、表面の再構成、レンダリング、さらなる処理といった下流のタスクを妨げる。
本稿では,GDGCNと呼ばれる粒度動的グラフ畳み込みネットワークについて紹介する。
論文 参考訳(メタデータ) (2024-11-21T14:19:32Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - ASWT-SGNN: Adaptive Spectral Wavelet Transform-based Self-Supervised
Graph Neural Network [20.924559944655392]
本稿では,適応スペクトルウェーブレット変換を用いた自己教師付きグラフニューラルネットワーク(ASWT-SGNN)を提案する。
ASWT-SGNNは高密度スペクトル領域におけるフィルタ関数を正確に近似し、コストの高い固有分解を避ける。
ノード分類タスクにおける最先端モデルに匹敵するパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-10T03:07:42Z) - Locality-Aware Generalizable Implicit Neural Representation [54.93702310461174]
一般化可能な暗黙的ニューラル表現(INR)は、単一の連続関数が複数のデータインスタンスを表現することを可能にする。
本稿では、変換器エンコーダと局所性を考慮したINRデコーダを組み合わせた一般化可能なINRのための新しいフレームワークを提案する。
我々のフレームワークは、従来の一般化可能なINRよりも大幅に優れており、下流タスクにおける局所性を考慮した潜在能力の有効性を検証している。
論文 参考訳(メタデータ) (2023-10-09T11:26:58Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。