論文の概要: Skewness-Guided Pruning of Multimodal Swin Transformers for Federated Skin Lesion Classification on Edge Devices
- arxiv url: http://arxiv.org/abs/2512.08751v1
- Date: Tue, 09 Dec 2025 16:01:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:08.039211
- Title: Skewness-Guided Pruning of Multimodal Swin Transformers for Federated Skin Lesion Classification on Edge Devices
- Title(参考訳): エッジデバイス上でのフェデレーション皮膚病変分類のためのマルチモーダルスイム変換器のスキューネス誘導プルーニング
- Authors: Kuniko Paxton, Koorosh Aslansefat, Dhavalkumar Thakker, Yiannis Papadopoulos,
- Abstract要約: 本研究では,マルチモーダルスイム変換器のマルチヘッド自己認識層とマルチ層パーセプトロン層を選択的にプルーニングするスキューネス誘導プルーニング法を提案する。
小型スウィントランスの実験では、精度を損なわずに約36%のモデルサイズ縮小を示した。
- 参考スコア(独自算出の注目度): 0.5133143243716792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, high-performance computer vision models have achieved remarkable success in medical imaging, with some skin lesion classification systems even surpassing dermatology specialists in diagnostic accuracy. However, such models are computationally intensive and large in size, making them unsuitable for deployment on edge devices. In addition, strict privacy constraints hinder centralized data management, motivating the adoption of Federated Learning (FL). To address these challenges, this study proposes a skewness-guided pruning method that selectively prunes the Multi-Head Self-Attention and Multi-Layer Perceptron layers of a multimodal Swin Transformer based on the statistical skewness of their output distributions. The proposed method was validated in a horizontal FL environment and shown to maintain performance while substantially reducing model complexity. Experiments on the compact Swin Transformer demonstrate approximately 36\% model size reduction with no loss in accuracy. These findings highlight the feasibility of achieving efficient model compression and privacy-preserving distributed learning for multimodal medical AI on edge devices.
- Abstract(参考訳): 近年、高性能コンピュータビジョンモデルは医療画像において顕著な成功を収めており、皮膚病変分類システムは診断精度において皮膚科スペシャリストを抜いたものさえある。
しかし、そのようなモデルは計算集約的であり、サイズが大きいため、エッジデバイスへのデプロイには適さない。
さらに、厳格なプライバシー制限は、集中的なデータ管理を妨げ、フェデレートラーニング(FL)の採用を動機付けている。
これらの課題に対処するために,マルチモーダルスウィントランスのマルチヘッド自己認識層とマルチ層パーセプトロン層を,出力分布の統計的スキューネスに基づいて選択的にプルーニングするスキューネス誘導プルーニング法を提案する。
提案手法は水平FL環境下での検証を行い, モデル複雑性を著しく低減し, 性能の維持を図った。
小型スウィントランスの実験では、精度を損なわずに約36 %のモデルサイズ縮小を示した。
これらの知見は,エッジデバイス上でのマルチモーダル医療AIにおいて,効率的なモデル圧縮とプライバシ保護型分散学習の実現可能性を強調した。
関連論文リスト
- GRASP: Guided Residual Adapters with Sample-wise Partitioning [10.504309161945065]
GRASP: サンプル分割によるガイド型残留アダプタを提案する。
長尾MIMIC-CXR-LTデータセットでは、GRASPは特に稀なクラスにおいて優れたFIDと多様性のメトリクスを得る。
論文 参考訳(メタデータ) (2025-12-01T13:43:17Z) - MedLiteNet: Lightweight Hybrid Medical Image Segmentation Model [17.73370811236741]
そこで本研究では,Dermoscopic segmentationに適した軽量CNNトランスフォーマーであるMedLiteNetを紹介する。
エンコーダは、Deep-wise Mobile Inverted Bottleneckブロックを積み重ねて計算を抑え、ボトルネックレベルのクロススケールトークン混合ユニットを挿入して解像度間で情報を交換し、境界対応の自己保持モジュールを埋め込み、病変の輪郭を鋭くする。
論文 参考訳(メタデータ) (2025-09-03T05:59:13Z) - Flattening Singular Values of Factorized Convolution for Medical Images [2.41019965808244]
畳み込みニューラルネットワーク(CNN)は、長い間、堅牢な医療画像処理(MIP)のパラダイムとして選択されてきた。
多くの方法は、限られた計算資源の負担を軽減するために、分解された畳み込み層を用いる。
MIPモデルにおける因子化畳み込みの表現力を向上させるために,Singular value equalization generalizer-induced Factorized Convolution (SFConv)を提案する。
論文 参考訳(メタデータ) (2024-03-01T15:30:50Z) - Improving Robustness and Reliability in Medical Image Classification with Latent-Guided Diffusion and Nested-Ensembles [4.249986624493547]
一度展開すると、医用画像解析法は予期せぬ画像の破損やノイズの摂動に直面することが多い。
LaDiNEは、視覚変換器のロバスト性と拡散に基づく生成モデルを組み合わせた、新しいアンサンブル学習手法である。
結核胸部X線とメラノーマ皮膚がんデータセットの実験により、LaDiNEは幅広い最先端の方法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-10-24T15:53:07Z) - Towards Better Certified Segmentation via Diffusion Models [62.21617614504225]
セグメンテーションモデルは敵の摂動に弱いため、医療や自動運転といった重要な意思決定システムでの使用を妨げます。
近年,理論的保証を得るためにガウス雑音を入力に加えることにより,セグメント化予測のランダム化が提案されている。
本稿では,ランダムな平滑化と拡散モデルを組み合わせたセグメンテーション予測の問題に対処する。
論文 参考訳(メタデータ) (2023-06-16T16:30:39Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Single Model Deep Learning on Imbalanced Small Datasets for Skin Lesion
Classification [5.642359877598896]
本稿では,小・不均衡なデータセットに基づく皮膚病変の単一モデル分類のための新しいデータ拡張戦略を提案する。
このデータセット上で、様々なDCNNがトレーニングされ、適度な複雑さを持つモデルがより大きなモデルより優れていることを示す。
修正RandAugmentとMulti-weighted Focal Lossを1つのDCNNモデルで組み合わせることで、ISIC 2018チャレンジテストデータセット上の複数のアンサンブルモデルに匹敵する分類精度を達成した。
論文 参考訳(メタデータ) (2021-02-02T03:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。