論文の概要: FreqU-FNet: Frequency-Aware U-Net for Imbalanced Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2505.17544v1
- Date: Fri, 23 May 2025 06:51:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.880039
- Title: FreqU-FNet: Frequency-Aware U-Net for Imbalanced Medical Image Segmentation
- Title(参考訳): FreqU-FNet:不均衡な医用画像分割のための周波数対応U-Net
- Authors: Ruiqi Xing,
- Abstract要約: FreqU-FNetは周波数領域で動作する新しいU字型セグメンテーションアーキテクチャである。
我々のフレームワークは、低パス畳み込みとDubechiesウェーブレットに基づくダウンサンプリングを利用する周波数を組み込んでいる。
複数の医療セグメンテーションベンチマークの実験では、FreqU-FNetはCNNとTransformerのベースラインを一貫して上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medical image segmentation faces persistent challenges due to severe class imbalance and the frequency-specific distribution of anatomical structures. Most conventional CNN-based methods operate in the spatial domain and struggle to capture minority class signals, often affected by frequency aliasing and limited spectral selectivity. Transformer-based models, while powerful in modeling global dependencies, tend to overlook critical local details necessary for fine-grained segmentation. To overcome these limitations, we propose FreqU-FNet, a novel U-shaped segmentation architecture operating in the frequency domain. Our framework incorporates a Frequency Encoder that leverages Low-Pass Frequency Convolution and Daubechies wavelet-based downsampling to extract multi-scale spectral features. To reconstruct fine spatial details, we introduce a Spatial Learnable Decoder (SLD) equipped with an adaptive multi-branch upsampling strategy. Furthermore, we design a frequency-aware loss (FAL) function to enhance minority class learning. Extensive experiments on multiple medical segmentation benchmarks demonstrate that FreqU-FNet consistently outperforms both CNN and Transformer baselines, particularly in handling under-represented classes, by effectively exploiting discriminative frequency bands.
- Abstract(参考訳): 医用画像のセグメンテーションは、重度のクラス不均衡と、解剖学的構造の頻度特異的分布により、永続的な課題に直面している。
従来のCNNベースのほとんどの手法は空間領域で動作し、周波数エイリアシングやスペクトル選択性に左右されるマイノリティクラス信号の捕捉に苦慮している。
トランスフォーマーベースのモデルは、グローバルな依存関係のモデリングにおいて強力であるが、きめ細かなセグメンテーションに必要な重要な局所的な詳細を見逃す傾向がある。
これらの制約を克服するために、周波数領域で動作する新しいU字型セグメンテーションアーキテクチャであるFreqU-FNetを提案する。
我々のフレームワークは、低パス周波数変換とDubechiesウェーブレットに基づくダウンサンプリングを利用して、マルチスケールのスペクトル特徴を抽出する周波数エンコーダを組み込んでいる。
空間的詳細を再現するために,適応型マルチブランチアップサンプリング戦略を備えた空間学習型デコーダ(SLD)を導入する。
さらに、マイノリティクラス学習を強化するために、周波数認識損失(FAL)関数を設計する。
複数の医用セグメンテーションベンチマークの大規模な実験により、FreqU-FNetはCNNとTransformerのベースライン、特に非表現クラスを扱う際に、識別周波数帯域を効果的に活用することで、一貫して性能が向上していることが示された。
関連論文リスト
- FAD: Frequency Adaptation and Diversion for Cross-domain Few-shot Learning [35.40065954148091]
ドメイン間数ショット学習では、大きな分散シフトの下で限定ラベル付きサンプルからモデルを一般化する必要がある。
本稿では、スペクトル成分を明示的にモデル化・変調する周波数対応フレームワークである周波数適応・変換(FAD)を紹介する。
FADは、目に見えないドメインと見えないドメインの両方において、最先端のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-13T08:48:06Z) - LOGLO-FNO: Efficient Learning of Local and Global Features in Fourier Neural Operators [20.77877474840923]
高周波情報は機械学習における重要な課題である。
ディープニューラルネットワークは、低周波成分の学習に対するいわゆるスペクトルバイアスを示す。
放射結合スペクトル誤差に基づく新しい周波数感受性損失項を提案する。
論文 参考訳(メタデータ) (2025-04-05T19:35:04Z) - FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - Spatial-Frequency Dual Progressive Attention Network For Medical Image Segmentation [11.60636221012585]
医用画像では、様々な種類の病変が、形状やテクスチャに顕著な違いを呈することが多い。
正確な医用画像セグメンテーションは、マルチスケールおよびバウンダリの特徴学習において堅牢な機能を持つディープラーニングモデルを必要とする。
本稿では,空間周波数デュアルドメインアテンションネットワークであるSF-UNetを紹介する。
マルチスケールプログレッシブ・チャンネル・アテンション(MPCA)ブロックは隣接するエンコーダ層にまたがるマルチスケールの特徴を徐々に抽出し、軽量な周波数空間アテンション(FSA)ブロックはわずか0.05Mのパラメータしか持たない。
論文 参考訳(メタデータ) (2024-06-12T07:22:05Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - Frequency-aware Discriminative Feature Learning Supervised by
Single-Center Loss for Face Forgery Detection [89.43987367139724]
顔の偽造検出は、コンピュータビジョンへの関心をますます高めている。
近年の業績は良好なものとなっているが、いまだに無視できない問題がある。
本稿では,新しい周波数認識型特徴学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-16T14:17:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。