論文の概要: CHASM: Cross-frequency Harmonized Axis-Separable Mixing for Spectral Token Operators
- arxiv url: http://arxiv.org/abs/2605.14727v1
- Date: Thu, 14 May 2026 11:54:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.801915
- Title: CHASM: Cross-frequency Harmonized Axis-Separable Mixing for Spectral Token Operators
- Title(参考訳): CHASM:スペクトルトークン演算子用クロス周波数高調波軸分離混合
- Authors: Pengcheng Fang, Hongli Chen, Yuxia Chen, Tengjiao Sun, Jiaxin Liu, Xiaohao Cai,
- Abstract要約: CHASMは、周波数周波数のハーモナイズド軸分離ミキサーである。
共有基底演算子ファミリーの構造解析を行い、制御された同バックボーン比較によりCHASMを評価する。
- 参考スコア(独自算出の注目度): 9.12744040532995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spectral token mixers based on Fourier transforms provide an efficient way to model global interactions in visual feature maps. Existing designs often either apply filter-wise spectral responses along fixed channel axes, or learn adaptive frequency-indexed channel mixing without explicitly aligning the channel directions used across frequencies. We propose CHASM, a Cross-frequency Harmonized Axis-Separable Mixer, as a structured middle ground. CHASM separates what should be shared from what should remain frequency-specific: all frequencies share a learned channel eigenbasis, while each frequency retains its own positive spectral gains. The shared basis makes channel directions comparable across the spectrum, whereas the positive gains preserve local spectral adaptivity. CHASM applies this structured operator separably along the height and width axes and is used as a drop-in replacement mixer inside existing backbones. We provide a structural characterization of the shared-basis operator family and evaluate CHASM through controlled same-backbone comparisons. Across accelerated MRI reconstruction, undersampled MRI segmentation, and natural-image reconstruction, CHASM consistently improves over same-backbone spectral-mixer baselines. Ablations show that removing the shared-basis constraint weakens performance, and randomizing coherent sampling geometry substantially reduces the gain, supporting cross-frequency harmonization as a useful inductive bias for spectral token operators.
- Abstract(参考訳): フーリエ変換に基づくスペクトルトークンミキサーは、視覚特徴写像における大域的相互作用をモデル化する効率的な方法を提供する。
既存の設計では、固定されたチャネル軸に沿ってフィルタのスペクトル応答を適用したり、周波数を横断するチャネル方向を明示的に調整することなく適応的な周波数付きチャネルミキシングを学習することがある。
CHASM(Cross- frequency Harmonized Axis-Separable Mixer)を中層構造として提案する。
全ての周波数は学習されたチャネル固有基底を共有し、各周波数は独自の正のスペクトルゲインを保持する。
共有基底はチャネル方向をスペクトル全体で比較するが、正の利得は局所的なスペクトル適応性を保持する。
CHASMはこの構造上の演算子を高さと幅の軸に沿って分離して適用し、既存のバックボーン内のドロップイン交換ミキサーとして使用される。
共有基底演算子ファミリーの構造解析を行い、制御された同バックボーン比較によりCHASMを評価する。
CHASMは、MRI再構成、アンダーサンプリングMRIセグメント化、自然像再構成など、バックボーンスペクトル-ミキサーベースラインを継続的に改善する。
アブレーションにより、共有基底制約の除去は性能を低下させ、コヒーレントサンプリング幾何のランダム化は利得を著しく減少させ、スペクトルトークン演算子に有用な帰納バイアスとしてクロス周波数調和をサポートすることが示されている。
関連論文リスト
- Learning to Separate RF Signals Under Uncertainty: Detect-Then-Separate vs. Unified Joint Models [53.79667447811139]
受信した信号に直接適用した場合、単一のディープニューラルネットワークアーキテクチャが共同で検出および分離することを学習していることを示す。
これらの結果から,UJM は DTS に代わるスケーラブルで実用的な代替品であり,広範に推定された統合分離のための新たな方向を開拓した。
論文 参考訳(メタデータ) (2026-02-04T15:25:02Z) - SKANet: A Cognitive Dual-Stream Framework with Adaptive Modality Fusion for Robust Compound GNSS Interference Classification [47.20483076887704]
グローバルナビゲーション衛星システム(GNSS)は、洗練された妨害による脅威の増大に直面している。
時間周波数画像(TFI)とパワースペクトル密度(PSD)を統合した2重ストリームアーキテクチャに基づく認知的ディープラーニングフレームワークを提案する。
SKANetは96.99%の精度を達成し、複合妨害分類において優れたロバスト性を示した。
論文 参考訳(メタデータ) (2026-01-19T07:42:45Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - FAD: Frequency Adaptation and Diversion for Cross-domain Few-shot Learning [35.40065954148091]
ドメイン間数ショット学習では、大きな分散シフトの下で限定ラベル付きサンプルからモデルを一般化する必要がある。
本稿では、スペクトル成分を明示的にモデル化・変調する周波数対応フレームワークである周波数適応・変換(FAD)を紹介する。
FADは、目に見えないドメインと見えないドメインの両方において、最先端のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-13T08:48:06Z) - PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification [49.37555541088792]
位相振幅デカップリング(PAD)は、位相(モダリティ共有)と振幅(モダリティ補完)を分離する周波数対応のフレームワークである。
この研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-04-27T07:21:42Z) - CATCH: Channel-Aware multivariate Time Series Anomaly Detection via Frequency Patching [24.927390742543707]
周波数パッチに基づくフレームワークであるCATCHを紹介する。
本稿では,パッチワイドマスクジェネレータとマスクアテンション機構を備えたChannel Fusion Module (CFM)を提案する。
10の現実世界のデータセットと12の合成データセットの実験は、CATCHが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-10-16T05:58:55Z) - Accelerated Multi-Contrast MRI Reconstruction via Frequency and Spatial Mutual Learning [50.74383395813782]
本稿では,周波数・空間相互学習ネットワーク(FSMNet)を提案する。
提案したFSMNetは, 加速度係数の異なるマルチコントラストMR再構成タスクに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T12:02:47Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。