論文の概要: Structured Spectral Reasoning for Frequency-Adaptive Multimodal Recommendation
- arxiv url: http://arxiv.org/abs/2512.01372v1
- Date: Mon, 01 Dec 2025 07:39:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.747294
- Title: Structured Spectral Reasoning for Frequency-Adaptive Multimodal Recommendation
- Title(参考訳): 周波数適応型マルチモーダルレコメンデーションのための構造スペクトル推論
- Authors: Wei Yang, Rui Zhong, Yiqun Chen, Chi Lu, Peng Jiang,
- Abstract要約: マルチモーダルレコメンデーションは、視覚情報やテキスト情報などの異種コンテンツと協調的な信号を統合することを目的としている。
これらの問題は、しばしば単純融合や浅いモデリング戦略によって悪化し、一般化の低下とロバスト性の低下につながる。
周波数対応マルチモーダルレコメンデーションのための構造化スペクトル推論フレームワークを提案する。
- 参考スコア(独自算出の注目度): 13.886659472425393
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal recommendation aims to integrate collaborative signals with heterogeneous content such as visual and textual information, but remains challenged by modality-specific noise, semantic inconsistency, and unstable propagation over user-item graphs. These issues are often exacerbated by naive fusion or shallow modeling strategies, leading to degraded generalization and poor robustness. While recent work has explored the frequency domain as a lens to separate stable from noisy signals, most methods rely on static filtering or reweighting, lacking the ability to reason over spectral structure or adapt to modality-specific reliability. To address these challenges, we propose a Structured Spectral Reasoning (SSR) framework for frequency-aware multimodal recommendation. Our method follows a four-stage pipeline: (i) Decompose graph-based multimodal signals into spectral bands via graph-guided transformations to isolate semantic granularity; (ii) Modulate band-level reliability with spectral band masking, a training-time masking with a prediction-consistency objective that suppresses brittle frequency components; (iii) Fuse complementary frequency cues using hyperspectral reasoning with low-rank cross-band interaction; and (iv) Align modality-specific spectral features via contrastive regularization to promote semantic and structural consistency. Experiments on three real-world benchmarks show consistent gains over strong baselines, particularly under sparse and cold-start settings. Additional analyses indicate that structured spectral modeling improves robustness and provides clearer diagnostics of how different bands contribute to performance.
- Abstract(参考訳): マルチモーダルレコメンデーションは、視覚情報やテキスト情報などの異種コンテンツと協調的な信号を統合することを目的としている。
これらの問題は、しばしば単純融合や浅いモデリング戦略によって悪化し、一般化の低下とロバスト性の低下につながる。
最近の研究は、ノイズの多い信号から安定した周波数領域を分離するためのレンズとして周波数領域を探索してきたが、ほとんどの手法は静的フィルタリングや再重み付けに依存しており、スペクトル構造を推論したり、モダリティ固有の信頼性に適応する能力に欠けていた。
これらの課題に対処するために、周波数対応マルチモーダルレコメンデーションのためのStructured Spectral Reasoning (SSR) フレームワークを提案する。
私たちの方法は4段階のパイプラインに従っています。
一 グラフに基づくマルチモーダル信号をグラフ誘導変換によりスペクトル帯域に分解し、意味的粒度を分離すること。
二 スペクトル帯マスキングによる帯域レベルの信頼性の変調、不安定な周波数成分を抑制する予測整合性目標による訓練時マスキング
3 低ランククロスバンド相互作用を用いた高スペクトル推論を用いたファス補完周波数キュー
(4) 意味的・構造的整合性を促進するために, コントラスト正則化によるアライメント特異的スペクトル特徴
実世界の3つのベンチマークの実験では、特にスパースとコールドスタートの設定下では、強いベースラインよりも一貫した利得を示している。
さらなる分析により、構造化スペクトルモデリングはロバスト性を改善し、異なるバンドがパフォーマンスにどう貢献するかをより明確に診断する。
関連論文リスト
- Frequency-Domain Decomposition and Recomposition for Robust Audio-Visual Segmentation [60.9960601057956]
本稿では2つの主要なモジュールからなる周波数対応オーディオ・ビジュアルコンポスタ(FAVS)フレームワークを紹介する。
FAVSフレームワークは、3つのベンチマークデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-09-23T12:33:48Z) - From Eigenmodes to Proofs: Integrating Graph Spectral Operators with Symbolic Interpretable Reasoning [0.0]
完全スペクトル型ニューロシンボリック推論フレームワークであるSpectral NSRを紹介する。
論理ルールをスペクトルテンプレートとして組み込み、グラフスペクトル領域で直接推論を行う。
スペクトルNSRは, 高い精度, 高速な推測, 対向摂動に対する頑健性の向上, 先行するベースラインと比較して高い解釈性を実現している。
論文 参考訳(メタデータ) (2025-09-07T01:12:20Z) - Frequency-Constrained Learning for Long-Term Forecasting [15.31488551912888]
実世界の時系列は、物理法則、人間のルーチン、季節周期から生じる強い周期構造を示す。
現代の深層予測モデルは、スペクトルバイアスと周波数認識による誘導前兆の欠如により、繰り返し発生するパターンを捉えることができないことが多い。
本稿では,周期性を明示的にモデル化し,長期予測を効果的に行う手法を提案する。
論文 参考訳(メタデータ) (2025-08-02T22:12:15Z) - SpectrumFM: Redefining Spectrum Cognition via Foundation Modeling [65.65474629224558]
本稿ではスペクトル認識のための新しいパラダイムを提供するスペクトルFMと呼ばれるスペクトル基盤モデルを提案する。
畳み込みニューラルネットワークを利用した革新的なスペクトルエンコーダを提案し、スペクトルデータにおける微細な局所信号構造と高レベルのグローバルな依存関係の両方を効果的に捕捉する。
2つの新しい自己教師型学習タスク、すなわちマスク付き再構成と次のスロット信号予測が、SpectrumFMの事前学習のために開発され、モデルがリッチで伝達可能な表現を学習できるようにする。
論文 参考訳(メタデータ) (2025-08-02T14:40:50Z) - Robust Spectral Fuzzy Clustering of Multivariate Time Series with Applications to Electroencephalogram [6.62414474989199]
スペクトル領域にファジィクラスタリングフレームワークを導入し、変数間の周波数特異なモノトニックな関係を抽出する。
本手法は、クラスタリング精度を向上させるために、周波数ベースのクロスリージョン接続パターンを優先的に活用する。
フラッグシップアプリケーションとして脳波記録を解析し,潜在認知状態の周波数・接続性特異的マーカーを明らかにする。
論文 参考訳(メタデータ) (2025-06-28T12:02:01Z) - PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification [49.37555541088792]
位相振幅デカップリング(PAD)は、位相(モダリティ共有)と振幅(モダリティ補完)を分離する周波数対応のフレームワークである。
この研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-04-27T07:21:42Z) - Disentangling Modes and Interference in the Spectrogram of Multicomponent Signals [4.570664073341981]
本稿では,マルチコンポーネント信号のスペクトルをモード部と干渉部に分解する方法について検討する。
i) 画像処理におけるテクスチャ・幾何学的分解に着想を得た変分法と, (ii) U-Netアーキテクチャを用いた教師あり学習手法の2つのアプローチを探索する。
数値解析実験は、スペクトル分解における両方のアプローチの利点と限界を示し、強い干渉の存在下での時間周波数解析の強化の可能性を強調している。
論文 参考訳(メタデータ) (2025-03-19T08:36:20Z) - MFRS: A Multi-Frequency Reference Series Approach to Scalable and Accurate Time-Series Forecasting [51.94256702463408]
時系列予測は、周波数の異なる周期特性から導かれる。
マルチ周波数参照系列相関解析に基づく新しい時系列予測手法を提案する。
主要なオープンデータセットと合成データセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-03-11T11:40:14Z) - Towards a Novel Perspective on Adversarial Examples Driven by Frequency [7.846634028066389]
異なる周波数帯域を組み合わせたブラックボックス逆攻撃アルゴリズムを提案する。
複数のデータセットとモデルで実施された実験により、低周波帯域と低周波帯域の高周波成分を組み合わせることで、攻撃効率が著しく向上することが示された。
論文 参考訳(メタデータ) (2024-04-16T00:58:46Z) - Spectral Decomposition Representation for Reinforcement Learning [100.0424588013549]
本稿では, スペクトル分解表現法(SPEDER)を提案する。この手法は, データ収集ポリシーに急激な依存を生じさせることなく, ダイナミックスから状態-作用の抽象化を抽出する。
理論的解析により、オンライン設定とオフライン設定の両方において提案アルゴリズムのサンプル効率が確立される。
実験により、いくつかのベンチマークで現在の最先端アルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-08-19T19:01:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。