論文の概要: Fourier Transform Multiple Instance Learning for Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2510.15138v2
- Date: Tue, 21 Oct 2025 17:57:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:11.531144
- Title: Fourier Transform Multiple Instance Learning for Whole Slide Image Classification
- Title(参考訳): 全スライド画像分類のためのフーリエ変換多重インスタンス学習
- Authors: Anthony Bilic, Guangyu Sun, Ming Li, Md Sanzid Bin Hossain, Yu Tian, Wei Zhang, Laura Brattain, Dexter Hadley, Chen Chen,
- Abstract要約: Whole Slide Image (WSI)分類は、空間パッチ機能を備えたMIL(Multiple Instance Learning)に依存している。
本稿では、MILを周波数領域の分岐で拡張し、コンパクトなグローバルコンテキストを提供するフレームワークを提案する。
FFT-MILは3つの公開データセット上で6つの最先端MIL手法で評価された。
- 参考スコア(独自算出の注目度): 13.494732719425159
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Whole Slide Image (WSI) classification relies on Multiple Instance Learning (MIL) with spatial patch features, yet existing methods struggle to capture global dependencies due to the immense size of WSIs and the local nature of patch embeddings. This limitation hinders the modeling of coarse structures essential for robust diagnostic prediction. We propose Fourier Transform Multiple Instance Learning (FFT-MIL), a framework that augments MIL with a frequency-domain branch to provide compact global context. Low-frequency crops are extracted from WSIs via the Fast Fourier Transform and processed through a modular FFT-Block composed of convolutional layers and Min-Max normalization to mitigate the high variance of frequency data. The learned global frequency feature is fused with spatial patch features through lightweight integration strategies, enabling compatibility with diverse MIL architectures. FFT-MIL was evaluated across six state-of-the-art MIL methods on three public datasets (BRACS, LUAD, and IMP). Integration of the FFT-Block improved macro F1 scores by an average of 3.51% and AUC by 1.51%, demonstrating consistent gains across architectures and datasets. These results establish frequency-domain learning as an effective and efficient mechanism for capturing global dependencies in WSI classification, complementing spatial features and advancing the scalability and accuracy of MIL-based computational pathology.
- Abstract(参考訳): Whole Slide Image(WSI)分類は、空間的パッチ機能を備えたMIL(Multiple Instance Learning)に依存しているが、既存のメソッドは、WSIの巨大なサイズとパッチ埋め込みのローカルな性質のために、グローバルな依存関係を捉えるのに苦労している。
この制限は、堅牢な診断予測に不可欠な粗い構造のモデリングを妨げる。
本稿では,MILを周波数領域ブランチで拡張し,コンパクトなグローバルコンテキストを提供するフレームワークであるFourier Transform Multiple Instance Learning (FFT-MIL)を提案する。
低周波の作物は、Fast Fourier Transformを介してWSIから抽出され、畳み込み層とMin-Max正規化からなるモジュラFFT-Blockによって処理され、周波数データの高分散を緩和する。
学習されたグローバル周波数機能は、軽量な統合戦略を通じて空間パッチ機能と融合し、多様なMILアーキテクチャとの互換性を実現する。
FFT-MILは3つの公開データセット(BRACS、LUAD、IMP)上で6つの最先端MIL手法で評価された。
FFT-Blockの統合によりマクロF1スコアは平均3.51%向上し、AUCは1.51%向上した。
これらの結果は、WSI分類におけるグローバルな依存関係を捕捉し、空間的特徴を補完し、MILベースの計算病理学のスケーラビリティと精度を向上するための効果的かつ効率的なメカニズムとして周波数領域学習を確立している。
関連論文リスト
- FractMorph: A Fractional Fourier-Based Multi-Domain Transformer for Deformable Image Registration [0.6683923149620578]
クロスイメージ特徴マッチングを向上する新しい3次元デュアル並列変換器アーキテクチャであるFractMorphを提案する。
軽量なU-Netスタイルのネットワークは、変換器に富んだ特徴から密度変形場を予測する。
その結果、FractMorphは、全体のDice similarity Coefficient(DSC)が86.45%$、平均1構造が75.15%$、95セントのHausdorff(HD95)が1.54mathrmmm$で、最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-08-17T17:42:10Z) - MsaMIL-Net: An End-to-End Multi-Scale Aware Multiple Instance Learning Network for Efficient Whole Slide Image Classification [0.7510165488300369]
バグベースのMIL(Multiple Instance Learning)アプローチが、WSI(Whole Slide Image)分類の主流方法論として登場した。
本稿では,マルチスケール特徴抽出と複数インスタンス学習を統合したエンドツーエンドのWSI分類フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-11T16:16:44Z) - Over-the-Air Fair Federated Learning via Multi-Objective Optimization [52.295563400314094]
本稿では,公平なFLモデルを訓練するためのOTA-FFL(Over-the-air Fair Federated Learning Algorithm)を提案する。
OTA-FFLの公正性とロバストな性能に対する優位性を示す実験を行った。
論文 参考訳(メタデータ) (2025-01-06T21:16:51Z) - Accelerated Multi-Contrast MRI Reconstruction via Frequency and Spatial Mutual Learning [50.74383395813782]
本稿では,周波数・空間相互学習ネットワーク(FSMNet)を提案する。
提案したFSMNetは, 加速度係数の異なるマルチコントラストMR再構成タスクに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T12:02:47Z) - Integrative Graph-Transformer Framework for Histopathology Whole Slide Image Representation and Classification [18.16710321320098]
デジタル病理学において、MIL(Multiple Case Learning)戦略は、弱い教師付き病理組織像全体(WSI)分類タスクにおいて広く用いられている。
既存の注意に基づくMILアプローチは、しばしば隣接する組織タイル間のコンテキスト情報や本質的な空間的関係を見落としている。
本稿では、文脈対応リレーショナル特徴とグローバルWSI表現を同時にキャプチャする統合グラフ変換フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-26T22:31:05Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - DeMFI: Deep Joint Deblurring and Multi-Frame Interpolation with
Flow-Guided Attentive Correlation and Recursive Boosting [50.17500790309477]
DeMFI-Netは、共同でデブロアリングとマルチフレームのフレームワークである。
低フレームレートのぼやけたビデオを高フレームレートでシャープなビデオに変換する。
多様なデータセットに対して、最先端(SOTA)のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-19T00:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。