論文の概要: GCE-MIL: Faithful and Recoverable Evidence for Multiple Instance Learning in Whole-Slide Imaging
- arxiv url: http://arxiv.org/abs/2605.17456v1
- Date: Sun, 17 May 2026 13:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.099988
- Title: GCE-MIL: Faithful and Recoverable Evidence for Multiple Instance Learning in Whole-Slide Imaging
- Title(参考訳): GCE-MIL:全スライディングイメージングにおける複数インスタンス学習のための忠実で復元可能な証拠
- Authors: Xiangyu Li, Ran Su,
- Abstract要約: 多重インスタンス学習(MIL)は,WSI分類と生存予測の標準手法である。
GCE-MILは3つのインジェクションモードと3つのエビデンスコンポーネントによって実装されたバックボーンに依存しないラッパーである。
- 参考スコア(独自算出の注目度): 4.001315295826918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiple instance learning (MIL) is the standard approach for whole-slide image (WSI) classification and survival prediction, where attention-based models ag gregate patch features into slide-level predictions. These models treat attention weights as evidence for their predictions, but attention is optimized for classi fication, not for identifying which patches actually support the diagnosis. This conflation leads to three failures: selected patches are insufficient (keeping them alone drops Macro-F1 by 0.078), unnecessary (removing them barely changes the prediction), and unrecoverable (continuous attention scores disagree with discrete patch subsets used at inference). The central premise is that evidence quality should be optimized directly through explicit criteria- Sufficiency, Necessity, and Recov erability (S/N/R)- rather than inherited as a byproduct of classification. GCE-MIL is a backbone-agnostic wrapper implemented through three injection modes and three evidence components: a grounding mechanism that aligns selection with domain-specific concepts, noisy-OR coverage that acts as a differentiable proxy for interventional evidence search, and threshold-plus-repair recovery that converts continuous selectors into discrete subsets through marginal-guided repair. Across 9 backbones and 9 datasets (81 configurations), GCE-MIL improves average Macro-F1 by 0.024 and C-index by 0.014, reduces the continuous-discrete gap by 4-7, and increases complement degradation by 2-4. With optional tile prefiltering after discrete recovery, inference runs up to 5 faster while retaining 0.989 full-bag utility.
- Abstract(参考訳): マルチプル・インスタンス・ラーニング(MIL)は、スライディング・イメージ(WSI)分類と生存予測の標準手法であり、アテンションベースのモデルでは、パッチをスライドレベルの予測に集約する。
これらのモデルは、注意重みを予測の証拠として扱うが、注意は、どのパッチが診断を実際に支援しているかを特定するためではなく、分類単位に最適化されている。
この衝突は3つの失敗に繋がる: 選択されたパッチが不十分(単独でマクロF1を0.078に落とす)、不要(予測をほとんど変更しない)、発見不可能(推論で使用される個別のパッチサブセットと連続的なアテンションスコアが一致しない)。
中心的な前提は、エビデンスの品質は、分類の副産物として継承されるのではなく、明確な基準(十分性、必要性、およびRecov erability(S/N/R))によって直接最適化されるべきである。
GCE-MILは、3つのインジェクションモードと3つのエビデンスコンポーネントによって実装されたバックボーン非依存ラッパーである。ドメイン固有の概念と選択を整合させる基盤機構、介入エビデンス探索の微分可能なプロキシとして機能するノイズORカバレッジ、連続セレクタを境界誘導修復によって個別サブセットに変換するしきい値+リペアリカバリである。
9つのバックボーンと9つのデータセット(81構成)にまたがって、GCE-MILは平均的なMacro-F1を0.024改善し、C-indexを0.014改善し、連続的な分散ギャップを4-7に減らし、補完的な分解を2-4に増やした。
離散回復後のオプションタイル事前フィルタでは、推論は最大5倍速くなり、0.989のフルバグユーティリティを保持する。
関連論文リスト
- Rethinking Molecular OOD Generalization via Target-Aware Source Selection [10.102858221967791]
SCOPE-BENCHは、明示的な物理化学的記述空間におけるクラスタレベルのパーティショニングに基づいて構築されたベンチマークである。
POMAは、知識伝達を検索-合成-適応パイプラインとして定式化するフレームワークである。
SCOPE-BENCHにおける最先端の3D分子モデルの予測誤差は平均5.9倍である。
論文 参考訳(メタデータ) (2026-05-13T16:09:46Z) - Architecture-Agnostic Modality-Isolated Gated Fusion for Robust Multi-Modal Prostate MRI Segmentation [0.0]
多重化前立腺MRIは、T2パラメトリック(T2W)、見かけ拡散係数(ADC)、高b値拡散強調(HBV)配列を組み合わせる。
実際には、拡散配列は、T2Wよりも、取得のばらつき、動き、アーティファクトの影響を受けることが多い。
我々は、学習ゲーティングステージの前に、個別のモダリティ固有の符号化ストリームを維持するために、Modality-Isolated Gated Fusion (MIGF)を提案する。
論文 参考訳(メタデータ) (2026-04-12T15:54:21Z) - Learning from Emptiness: De-biasing Listwise Rerankers with Content-Agnostic Probability Calibration [76.08899010904652]
CapCalは、ランキング決定から位置バイアスを機械的に分離する、トレーニング不要のフレームワークである。
シングルパス効率を保ちながら、トレーニング不要の手法で優れた性能を発揮する。
論文 参考訳(メタデータ) (2026-04-11T10:47:22Z) - ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging [95.36377714370325]
注意に基づく複数インスタンス学習手法は、不安定な注意力学という新しい障害モードを示す。
本稿では,新しい統合フレームワークであるASMIL(At attention-stabilized multiple instance learning)を紹介する。
ASMILはアンカーモデルを用いて注意を安定させ、ソフトマックスをアンカー内の正規化シグモイド関数に置き換えて過集中を防ぐ。
論文 参考訳(メタデータ) (2026-03-01T18:31:13Z) - ClinNet: Evidential Ordinal Regression with Bilateral Asymmetry and Prototype Memory for Knee Osteoarthritis Grading [3.337151338735509]
X線画像に基づく膝関節症(KOA)の診断は極めて難しい課題である。
本研究では, KOA グレーディングに対処する信頼性の高い新しいフレームワーク ClinNet を提案する。
論文 参考訳(メタデータ) (2026-01-24T05:49:41Z) - vAttention: Verified Sparse Attention [100.98210818821688]
vAttentionは、ユーザが指定した$(epsilon, delta)$の近似精度保証(thus, confirmed)を備えた実用的なスパースアテンションメカニズムである。
vAttentionはデータセット間のスパースアテンションの質を大幅に改善することを示す。
モデルの品質を損なうことなく高速なデコードを実現するために、推論シナリオにデプロイすることができる。
論文 参考訳(メタデータ) (2025-10-07T08:46:08Z) - AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free [81.65559031466452]
我々は、ゲーティング強化ソフトマックスアテンションの変種を調べる実験を行った。
SDPA(Scaled Dot-Product Attention)後の頭部特異的シグモイドゲートを簡易に修正することで,性能が向上することがわかった。
論文 参考訳(メタデータ) (2025-05-10T17:15:49Z) - Distilling High Diagnostic Value Patches for Whole Slide Image Classification Using Attention Mechanism [11.920941310806558]
MIL(Multiple Instance Learning)はWSI(Whole Slide Image)分類の分野で広く注目を集めている。
バッグレベルのMILメソッドの欠点は、より冗長なパッチの導入であり、干渉につながる。
我々は,高い診断値のパッチを抽出するAFD-MIL (Feature Respiration Multi-Instance Learning) アプローチを開発した。
論文 参考訳(メタデータ) (2024-07-29T09:14:21Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。