論文の概要: Magnification-Invariant Image Classification via Domain Generalization and Stable Sparse Embedding Signatures
- arxiv url: http://arxiv.org/abs/2604.25817v1
- Date: Tue, 28 Apr 2026 16:26:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.948684
- Title: Magnification-Invariant Image Classification via Domain Generalization and Stable Sparse Embedding Signatures
- Title(参考訳): 領域一般化と安定なスパース埋め込み符号による拡大不変画像分類
- Authors: Ifeanyi Ezuma, Olusiji Medaiyese,
- Abstract要約: マグニフィケーションシフトは、あるスケールで訓練されたモデルが、しばしば他のスケールにあまり一般化しないため、頑健な病理組織学分類の大きな障害である。
本研究では, 厳密な患者分離型Let-one-magnification-outプロトコルを用いて, BreaKHisデータセット上でこの問題を評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Magnification shift is a major obstacle to robust histopathology classification, because models trained on one imaging scale often generalize poorly to another. Here, we evaluated this problem on the BreaKHis dataset using a strict patient-disjoint leave-one-magnification-out protocol, comparing supervised baseline, baseline augmented with DCGAN-generated patches, and a gradient-reversal domain-general model designed to preserve discriminative information while suppressing magnification-specific variation. Across held-out magnifications, the domain-general model achieved the strongest overall discrimination and its clearest gain was observed when 200X was held out. By contrast, GAN augmentation produced inconsistent effects, improving some folds but degrading others, particularly at 400X. The domain-general model also yielded the lowest Brier score at 0.063 vs 0.089 at baseline. Sparse embedding analysis further revealed that domain-general training reduced average signature size more than three-fold (306 versus 1,074 dimensions) while preserving equivalent predictive performance (AUC: 0.967 vs 0.965; F1: 0.930 vs 0.931). It also increased cross-fold signature reproducibility from near-zero Jaccard overlap in the baseline to 0.99 between the 100X and 200X folds. These findings show that calibrated, compact, and transferable representations can be learned without added architectural complexity, with clear implications for the reliable deployment of computational pathology models across heterogeneous acquisition settings.
- Abstract(参考訳): 拡大シフトは、ある画像スケールで訓練されたモデルは、しばしば別の画像スケールにあまり一般化しないため、堅牢な病理組織分類の大きな障害である。
本稿では,厳密な患者分離型残像出力プロトコルを用いてBreaKHisデータセット上でこの問題を評価し,管理ベースライン,DCGAN生成パッチを付加したベースライン,識別情報の保存を目的とした勾配反転ドメインジェネラルモデルの比較を行った。
ドメイン・ジェネラル・モデルでは,200倍の倍率を達成し,200倍の差が認められた。
対照的に、GAN増強は矛盾する効果を生み出し、いくつかの折りたたみは改善したが、特に400Xでは他の折りたたみは低下した。
ドメインジェネラルモデルは、ベースラインで0.063と0.089で最低のブリアスコアを得た。
スパース埋め込み解析により,3倍以上の平均署名サイズ(306×1,074次元)を減らし,等価な予測性能(AUC:0.967×0.965; F1:0.930×0.931)を保った。
また、ベースラインのほぼゼロのジャカードのオーバーラップから100Xと200Xの間の0.99まで、クロスフォールドのシグネチャ再現性も向上した。
これらの結果から,不均一な取得設定にまたがる計算病理モデルの信頼性向上に寄与し,アーキテクチャ上の複雑さを伴わずに,校正,コンパクト化,伝達可能な表現を学習できることが示唆された。
関連論文リスト
- Robustness Evaluation of a Foundation Segmentation Model Under Simulated Domain Shifts in Abdominal CT: Implications for Health Digital Twin Deployment [0.0]
SAM(Segment Anything Model)のような基盤セグメンテーションモデルは、自然画像全体にわたって強力な一般化を実証している。
腹部CTにおける脾分画に対するSAMの系統的スライスレベルロバストネス検査を,41巻の非空切片1,051を用いて行った。
論文 参考訳(メタデータ) (2026-04-28T14:16:20Z) - Beyond Anatomy: Explainable ASD Classification from rs-fMRI via Functional Parcellation and Graph Attention Networks [6.923757075165361]
解剖学的脳解析は rs-fMRI に基づく自閉症スペクトラム障害 (ASD) の分類を支配している。
ABIDE Iデータセット上の解剖学的(AAL)と機能的(MSDL)パーセレーション戦略を比較したグラフベースのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-03T02:05:20Z) - Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection [2.8547732086436306]
教師付きディープラーニングの基本的限界は「一般化崩壊」である
階層型2段階表現学習フレームワークであるLatent Sculptingを提案する。
我々は「浸潤」のシナリオについて88.89%の検知率を報告した。
論文 参考訳(メタデータ) (2025-12-19T11:37:02Z) - Deep Unsupervised Anomaly Detection in Brain Imaging: Large-Scale Benchmarking and Bias Analysis [42.60508892284938]
脳画像の深部教師なし異常検出のための大規模マルチセンターベンチマークを提案する。
健康なデータセットと多様な臨床コホートにまたがる2,221T1wと1,262T2wのスキャンを行った。
我々のベンチマークは今後の研究の透明な基盤を確立し、臨床翻訳の優先順位を強調している。
論文 参考訳(メタデータ) (2025-12-01T11:03:27Z) - MeCaMIL: Causality-Aware Multiple Instance Learning for Fair and Interpretable Whole Slide Image Diagnosis [40.3028468133626]
MIL(Multiple Case Learning)は、コンピュータ病理学における全スライド画像(WSI)解析の主流パラダイムとして登場した。
因果関係を意識したMILフレームワークである textbfMeCaMIL は、構造化因果グラフを通じて、階層的共同創設者を明示的にモデル化する。
MeCaMILは優れた公正性を達成する -- 人口格差の分散は、属性全体の平均で65%以上減少する。
論文 参考訳(メタデータ) (2025-11-14T06:47:21Z) - MSRANetV2: An Explainable Deep Learning Architecture for Multi-class Classification of Colorectal Histopathological Images [3.4859776888706233]
大腸癌(CRC)は、世界中のがん関連死亡率の高い疾患である。
ディープラーニングアルゴリズムは、診断精度と効率を高めるための強力なアプローチとなっている。
大腸組織像の分類に最適化されたMSRANetV2という畳み込みニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-10-28T07:22:34Z) - Robust Atypical Mitosis Classification with DenseNet121: Stain-Aware Augmentation and Hybrid Loss for Domain Generalization [16.048949963804123]
筆者らはMIDOG 2025 (Track 2) 設定における非定型有糸分裂分類に適した DenseNet-121 ベースのフレームワークを提案する。
本手法は, クラス重み付き二元交叉エントロピーと焦点損失を併用したハイブリッド目的を用いて, ステンドアウェア拡張(マッケンコ), 幾何および強度変換, および重み付きサンプリングによる不均衡認識学習を統合する。
AdamWでエンドツーエンドにトレーニングされ、複数の独立したドメインで評価され、スキャナと染色シフトの下で強力な一般化が示され、バランスの取れた精度85.0%、AUROC 0.927、感度89.2%、そして公式テストセットの80.9%が達成された。
論文 参考訳(メタデータ) (2025-10-26T11:24:55Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - Corneal endothelium assessment in specular microscopy images with Fuchs'
dystrophy via deep regression of signed distance maps [48.498376125522114]
本稿では,UNetをベースとしたセグメンテーション手法を提案する。
これは、フックスのジストロフィーの全度にわたって、信頼できるCE形態計測と腸骨同定を実現する。
論文 参考訳(メタデータ) (2022-10-13T15:34:20Z) - Robust Representation via Dynamic Feature Aggregation [44.927408735490005]
ディープ畳み込みニューラルネットワーク(CNN)ベースのモデルは、敵の攻撃に対して脆弱である。
本稿では,新しい正規化により埋め込み空間を圧縮する動的特徴集約法を提案する。
CIFAR-10における攻撃法の平均精度は56.91%である。
論文 参考訳(メタデータ) (2022-05-16T06:22:15Z) - An interpretable classifier for high-resolution breast cancer screening
images utilizing weakly supervised localization [45.00998416720726]
医用画像の特徴に対処する枠組みを提案する。
このモデルはまず、画像全体の低容量だがメモリ効率のよいネットワークを使用して、最も情報性の高い領域を識別する。
次に、選択したリージョンから詳細を収集するために、別の高容量ネットワークを適用します。
最後に、グローバルおよびローカル情報を集約して最終的な予測を行うフュージョンモジュールを使用する。
論文 参考訳(メタデータ) (2020-02-13T15:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。