論文の概要: Spatial Frequency Modulation for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2507.11893v1
- Date: Wed, 16 Jul 2025 04:15:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.220678
- Title: Spatial Frequency Modulation for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのための空間周波数変調
- Authors: Linwei Chen, Ying Fu, Lin Gu, Dezhi Zheng, Jifeng Dai,
- Abstract要約: 本研究では, 周波数変動を低周波に変調する新しい空間周波数変調法を提案する。
また、変調された特徴を復調し、一様でないアップサンプリングにより高周波情報を復元するマルチスケール適応アップサンプリング(MSAU)を提案する。
画像分類, 対向ロバスト性, インスタンスセグメンテーション, 汎視的セグメンテーションタスクに拡張することで, SFMの幅広い適用性と有効性を検証する。
- 参考スコア(独自算出の注目度): 32.67776930209082
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High spatial frequency information, including fine details like textures, significantly contributes to the accuracy of semantic segmentation. However, according to the Nyquist-Shannon Sampling Theorem, high-frequency components are vulnerable to aliasing or distortion when propagating through downsampling layers such as strided-convolution. Here, we propose a novel Spatial Frequency Modulation (SFM) that modulates high-frequency features to a lower frequency before downsampling and then demodulates them back during upsampling. Specifically, we implement modulation through adaptive resampling (ARS) and design a lightweight add-on that can densely sample the high-frequency areas to scale up the signal, thereby lowering its frequency in accordance with the Frequency Scaling Property. We also propose Multi-Scale Adaptive Upsampling (MSAU) to demodulate the modulated feature and recover high-frequency information through non-uniform upsampling This module further improves segmentation by explicitly exploiting information interaction between densely and sparsely resampled areas at multiple scales. Both modules can seamlessly integrate with various architectures, extending from convolutional neural networks to transformers. Feature visualization and analysis confirm that our method effectively alleviates aliasing while successfully retaining details after demodulation. Finally, we validate the broad applicability and effectiveness of SFM by extending it to image classification, adversarial robustness, instance segmentation, and panoptic segmentation tasks. The code is available at \href{https://github.com/Linwei-Chen/SFM}{https://github.com/Linwei-Chen/SFM}.
- Abstract(参考訳): テクスチャなどの細部を含む高空間周波数情報はセグメンテーションの精度に大きく貢献する。
しかし、Nyquist-Shannon Smpling Theoremによると、ストライド畳み込みのようなダウンサンプリング層を伝播する際に高周波成分はエイリアスや歪みに弱い。
そこで本研究では,周波数変動を低周波に変調した新しい空間周波数変調法を提案する。
具体的には、適応再サンプリング(ARS)による変調を実装し、高周波領域を高密度にサンプリングして信号のスケールアップを可能にする軽量アドオンを設計し、周波数スケーリング特性に応じて周波数を下げる。
また、変調された特徴を復調し、非一様アップサンプリングにより高周波情報を復元するマルチスケール適応アップサンプリング(MSAU)を提案する。
どちらのモジュールも、畳み込みニューラルネットワークからトランスフォーマーまで、さまざまなアーキテクチャとシームレスに統合することができる。
特徴の可視化と解析により,復調後の細部を正確に保ちながらエイリアスを効果的に緩和できることを確認した。
最後に, 画像分類, 対向ロバスト性, インスタンスセグメンテーション, 汎視的セグメンテーションタスクに拡張することで, SFMの幅広い適用性と有効性を検証する。
コードは \href{https://github.com/Linwei-Chen/SFM}{https://github.com/Linwei-Chen/SFM} で公開されている。
関連論文リスト
- Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - FreqU-FNet: Frequency-Aware U-Net for Imbalanced Medical Image Segmentation [0.0]
FreqU-FNetは周波数領域で動作する新しいU字型セグメンテーションアーキテクチャである。
我々のフレームワークは、低パス畳み込みとDubechiesウェーブレットに基づくダウンサンプリングを利用する周波数を組み込んでいる。
複数の医療セグメンテーションベンチマークの実験では、FreqU-FNetはCNNとTransformerのベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-23T06:51:24Z) - FAD: Frequency Adaptation and Diversion for Cross-domain Few-shot Learning [35.40065954148091]
ドメイン間数ショット学習では、大きな分散シフトの下で限定ラベル付きサンプルからモデルを一般化する必要がある。
本稿では、スペクトル成分を明示的にモデル化・変調する周波数対応フレームワークである周波数適応・変換(FAD)を紹介する。
FADは、目に見えないドメインと見えないドメインの両方において、最先端のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-13T08:48:06Z) - Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [66.63250537475973]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。
実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文 参考訳(メタデータ) (2024-07-26T02:34:25Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Frequency-Adaptive Dilated Convolution for Semantic Segmentation [14.066404173580864]
本稿では、スペクトル分析の観点から、拡張畳み込みの個々の位相を改善するための3つの戦略を提案する。
周波数適応型拡張畳み込み(FADC)を導入し、局所周波数成分に基づいて空間的に拡散率を調整する。
2つのプラグインモジュールを設計し、有効帯域幅と受容フィールドサイズを直接的に拡張する。
論文 参考訳(メタデータ) (2024-03-08T15:00:44Z) - Frequency-Adaptive Pan-Sharpening with Mixture of Experts [22.28680499480492]
パンシャーピングのための新しい周波数適応型エキスパート混合学習フレームワーク(FAME)を提案する。
本手法は他の最先端技術に対して最善を尽くし,現実のシーンに対して強力な一般化能力を有する。
論文 参考訳(メタデータ) (2024-01-04T08:58:25Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。