論文の概要: SinBasis Networks: Matrix-Equivalent Feature Extraction for Wave-Like Optical Spectrograms
- arxiv url: http://arxiv.org/abs/2505.06275v2
- Date: Thu, 31 Jul 2025 14:24:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 15:10:45.048485
- Title: SinBasis Networks: Matrix-Equivalent Feature Extraction for Wave-Like Optical Spectrograms
- Title(参考訳): SinBasis Networks: Wave-like Optical Spectrogram のための行列等価特徴抽出
- Authors: Yuzhou Zhu, Zheng Zhang, Ruyi Zhang, Liang Zhou,
- Abstract要約: フラットな入力上での線形変換として、畳み込みと注意を再解釈する統一的行列等価フレームワークを提案する。
これらの変換をCNN、ViT、Capsuleアーキテクチャに埋め込むことで、Sin-Basis Networksは周期的なモチーフに対する感度を高めることができる。
- 参考スコア(独自算出の注目度): 8.37266944852829
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wave-like images-from attosecond streaking spectrograms to optical spectra, audio mel-spectrograms and periodic video frames-encode critical harmonic structures that elude conventional feature extractors. We propose a unified, matrix-equivalent framework that reinterprets convolution and attention as linear transforms on flattened inputs, revealing filter weights as basis vectors spanning latent feature subspaces. To infuse spectral priors we apply elementwise $\sin(\cdot)$ mappings to each weight matrix. Embedding these transforms into CNN, ViT and Capsule architectures yields Sin-Basis Networks with heightened sensitivity to periodic motifs and built-in invariance to spatial shifts. Experiments on a diverse collection of wave-like image datasets-including 80,000 synthetic attosecond streaking spectrograms, thousands of Raman, photoluminescence and FTIR spectra, mel-spectrograms from AudioSet and cycle-pattern frames from Kinetics-demonstrate substantial gains in reconstruction accuracy, translational robustness and zero-shot cross-domain transfer. Theoretical analysis via matrix isomorphism and Mercer-kernel truncation quantifies how sinusoidal reparametrization enriches expressivity while preserving stability in data-scarce regimes. Sin-Basis Networks thus offer a lightweight, physics-informed approach to deep learning across all wave-form imaging modalities.
- Abstract(参考訳): アト秒ストリーキングスペクトログラムから光学スペクトル、オーディオ・メル・スペクトログラム、周期ビデオフレームに至るまでのウェーブライクな画像は、従来の特徴抽出器を損なう重要なハーモニック構造をエンコードする。
本稿では,フラット化入力上での線形変換として,畳み込みと注意を解釈し,遅延特徴部分空間にまたがる基底ベクトルとしてフィルタ重みを明らかにする統一的行列等価フレームワークを提案する。
スペクトル事前を注入するために、各重み行列に$\sin(\cdot)$写像を要素的に適用する。
これらの変換をCNN、ViT、Capsuleアーキテクチャに埋め込むことで、Sin-Basis Networksは周期的なモチーフに対する感度を高め、空間シフトに対する不変性を内蔵する。
ラマン、フォトルミネッセンス、FTIRスペクトル、AudioSetのメル・スペクトログラム、Kinetics-demonstrateのサイクル・パターン・フレームを含む、80,000の合成アト秒ストライキング・スペクトログラムを含む様々な波形のような画像データセットの実験は、再構成の精度、翻訳の堅牢性、ゼロショットのクロスドメイン転送においてかなりの利益を上げている。
行列同型およびマーサー・カーネル・トランケーションによる理論的解析は、正弦波再パラメータ化がデータスカース状態の安定性を維持しながら、いかに表現性を高めるかを定量化する。
Sin-Basis Networksは、すべての波状画像モダリティにまたがるディープラーニングに対して、軽量で物理インフォームドなアプローチを提供する。
関連論文リスト
- A Differential Smoothness-based Compact-Dynamic Graph Convolutional Network for Spatiotemporal Signal Recovery [9.369246678101048]
本稿では、時間的信号回復のためのコンパクト・フォールド・コングラフ・ネットワーク(CDCN)を提案する。
実世界のデータセットの実験では、CDCNは時間的信号回復の最先端モデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-06T06:42:53Z) - Speed Limits for Deep Learning [67.69149326107103]
熱力学の最近の進歩は、初期重量分布から完全に訓練されたネットワークの最終分布への移動速度の制限を可能にする。
線形および線形化可能なニューラルネットワークに対して,これらの速度制限に対する解析式を提供する。
NTKスペクトルとラベルのスペクトル分解に関するいくつかの妥当なスケーリング仮定を考えると、学習はスケーリングの意味で最適である。
論文 参考訳(メタデータ) (2023-07-27T06:59:46Z) - Universal Scaling Laws of Absorbing Phase Transitions in Artificial Deep Neural Networks [0.8932296777085644]
信号伝播ダイナミクスの位相境界付近で動作する従来の人工深層ニューラルネットワークは、カオスのエッジとしても知られ、位相遷移を吸収する普遍的なスケーリング法則を示す。
我々は、伝搬力学の完全な決定論的性質を利用して、ニューラルネットワークの信号崩壊と吸収状態の類似を解明する。
論文 参考訳(メタデータ) (2023-07-05T13:39:02Z) - Fast and Robust State Estimation and Tracking via Hierarchical Learning [9.341558827016332]
我々は,大規模ネットワークにおけるコンバージェンスを高速化し,状態推定と追跡のレジリエンスを高めることを目的としている。
我々は,水中音響ネットワークと大規模合成ネットワークのシミュレーション研究を通じて,我々のアルゴリズムを数値的に検証する。
論文 参考訳(メタデータ) (2023-06-29T19:07:17Z) - Neuromorphic Optical Flow and Real-time Implementation with Event
Cameras [47.11134388304464]
イベントベースのビジョンとスパイクニューラルネットワークの最新の開発の上に構築しています。
我々は、最先端の自己監督型光フロー精度を向上させる新しいネットワークアーキテクチャを提案する。
約2桁の複雑さで高速な光流予測を行う。
論文 参考訳(メタデータ) (2023-04-14T14:03:35Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Unsupervised inter-frame motion correction for whole-body dynamic PET
using convolutional long short-term memory in a convolutional neural network [9.349668170221975]
我々は、フレーム間の身体の動きを補正するための教師なしのディープラーニングベースのフレームワークを開発する。
運動推定ネットワークは、畳み込み長短期記憶層を組み合わせた畳み込みニューラルネットワークである。
トレーニング後,提案したネットワークの動作推定時間は,従来の登録ベースラインの約460倍の速度であった。
論文 参考訳(メタデータ) (2022-06-13T17:38:16Z) - Discrete-time Temporal Network Embedding via Implicit Hierarchical
Learning in Hyperbolic Space [43.280123606888395]
双曲幾何学の指数的能力と階層的認識を生かした双曲時間グラフネットワーク(HTGN)を提案する。
HTGNは、時間グラフを双曲空間にマッピングし、双曲グラフニューラルネットワークと双曲ゲートリカレントニューラルネットワークを組み込む。
複数の実世界のデータセットに対する実験結果は、時間グラフ埋め込みにおけるHTGNの優位性を示している。
論文 参考訳(メタデータ) (2021-07-08T11:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。