論文の概要: QG-MIL: A Gated Transformer Aggregator for Domain-Agnostic Multiple Instance Learning in Medical Imaging
- arxiv url: http://arxiv.org/abs/2606.20027v1
- Date: Thu, 18 Jun 2026 09:58:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.783648
- Title: QG-MIL: A Gated Transformer Aggregator for Domain-Agnostic Multiple Instance Learning in Medical Imaging
- Title(参考訳): QG-MIL : 医用画像におけるドメイン非依存型マルチインスタンス学習のためのゲート変換器アグリゲータ
- Authors: Luca Zedda, Davide Antonio Mura, Cecilia Di Ruberto, Maurizio Atzori, Muhammed Furkan Dasdelen, Carsten Marr, Andrea Loddo,
- Abstract要約: 医療画像におけるアテンションに基づく多重インスタンス学習アグリゲータは、注意集中の傾向にある。
我々は,4つの相乗的アーキテクチャコンポーネントを通じてこの問題に対処するゲートトランスフォーマーアグリゲータであるQG-MILを紹介する。
本研究は,6つのベンチマークのQG-MILの評価を行い,2つのMIL尺度について検討した。
- 参考スコア(独自算出の注目度): 2.593919493461823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attention-based Multiple Instance Learning aggregators in medical imaging are prone to attention concentration, producing overconfident and unstable predictions. We introduce QG-MIL, a gated transformer aggregator that addresses this through four synergistic architectural components: RMSNorm-based pre-normalization, per-head QK normalization, fine-grained attention output gating, and SwiGLU-style feed-forward modules. Together, these design choices stabilize training and distribute attention more uniformly across instances without auxiliary losses, masking, or multi-stage regularization. We evaluate QG-MIL across six benchmarks spanning whole-slide pathology and cell-level hematology, covering two fundamentally different MIL scales. The best-performing QG-MIL variants outperform leading baselines on all six benchmarks, with an average improvement of +6.1 mean macro F1 points. Attention overlays and attention mass analysis confirm more distributed instance weighting. Ablation studies show that while individual components can match the full model on specific datasets, the QG-MIL design provides the most consistent cross-domain performance and tightest variance when compared to selected baselines. We release a configurable implementation to support reproducibility at: https://github.com/unica-visual-intelligence-lab/QG-MIL
- Abstract(参考訳): 注意に基づくマルチインスタンス・ラーニング・アグリゲータは、注意集中に傾向があり、過度な自信と不安定な予測をもたらす。
RMSNormベースの事前正規化、頭ごとのQK正規化、きめ細かな注意出力ゲーティング、SwiGLUスタイルのフィードフォワードモジュールである。
これらの設計選択は、トレーニングを安定させ、補助的な損失やマスキング、多段階の正規化なしに、より均一に注意をインスタンスに分散する。
本研究は,6つのベンチマークのQG-MILの評価を行い,2つのMIL尺度について検討した。
最高のパフォーマンスのQG-MIL変種は6つのベンチマークで上位のベースラインを上回り、平均的なマクロF1点の改善は+6.1である。
注意オーバーレイと注意質量分析により、より分散インスタンス重み付けが確認できる。
アブレーション研究では、個々のコンポーネントは特定のデータセットの完全なモデルにマッチするが、QG-MIL設計は、選択されたベースラインと比較して最も一貫性のあるクロスドメインパフォーマンスと厳密な分散を提供する。
https://github.com/unica-visual-intelligence-lab/QG-MIL
関連論文リスト
- ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging [95.36377714370325]
注意に基づく複数インスタンス学習手法は、不安定な注意力学という新しい障害モードを示す。
本稿では,新しい統合フレームワークであるASMIL(At attention-stabilized multiple instance learning)を紹介する。
ASMILはアンカーモデルを用いて注意を安定させ、ソフトマックスをアンカー内の正規化シグモイド関数に置き換えて過集中を防ぐ。
論文 参考訳(メタデータ) (2026-03-01T18:31:13Z) - scDFM: Distributional Flow Matching Model for Robust Single-Cell Perturbation Prediction [12.48933770510505]
条件付きフローマッチングに基づく生成フレームワークである scDFM を提案する。
scDFMは、細胞レベルでの通信以上の個体群を混乱させ、制御する。
論文 参考訳(メタデータ) (2026-02-06T17:00:21Z) - From Global to Granular: Revealing IQA Model Performance via Correlation Surface [83.65597122328133]
我々は, IQA 性能の構造化, きめ細かな解析を行う textbfGranularity-Modulated correlation (GMC) を提案する。
GMCにはtextbfDistribution Regulatorが含まれており、相関関係を規則化し、非均一な品質分布からのバイアスを軽減する。
標準ベンチマークの実験では、GCCはスカラーメトリクスに見えないパフォーマンス特性を示し、IQAモデルを分析、比較、デプロイするためのより情報に富んだ信頼性の高いパラダイムを提供する。
論文 参考訳(メタデータ) (2026-01-29T13:55:26Z) - MS-ISSM: Objective Quality Assessment of Point Clouds Using Multi-scale Implicit Structural Similarity [65.85858856481131]
点雲の非構造的で不規則な性質は、客観的品質評価(PCQA)に重大な課題をもたらす
マルチスケールインシシシット構造類似度測定(MS-ISSM)を提案する。
論文 参考訳(メタデータ) (2026-01-03T14:58:52Z) - GAS-MIL: Group-Aggregative Selection Multi-Instance Learning for Ensemble of Foundation Models in Digital Pathology Image Analysis [6.45975531973783]
GAS-MILはフレキシブルアンサンブルフレームワークで、複数の基盤モデルの機能をシームレスに統合する。
個々のFMに対して優れた性能またはオンパー性能を達成し、MIL法を確立した。
将来のマルチモーダルおよび精度オンコロジーアプリケーションのためのスケーラブルな基盤を提供する。
論文 参考訳(メタデータ) (2025-10-03T22:59:40Z) - Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis [8.076987502347327]
病理基盤モデル(PFM)は、スライド画像全体(WSI)を解析するための強力なツールとして登場した。
TAPFMは、特徴表現と注目重みの両方を最適化しながら、MILアグリゲーションに視覚変換器(ヴィット)アテンションを使用する。
膀胱癌および肺腺癌に対する突然変異予測タスクの評価。
論文 参考訳(メタデータ) (2025-06-05T15:56:45Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - Multiplex-detection Based Multiple Instance Learning Network for Whole
Slide Image Classification [2.61155594652503]
マルチ・インスタンス・ラーニング(MIL)は、診断病理のためのスライド画像全体(WSI)を分類する強力な手法である。
本稿では,上記の問題に対処するために,MDMIL(Multiple-detection-based multiple instance learning)を提案する。
具体的には、MDMILは内部クエリ生成モジュール(IQGM)と多重検出モジュール(MDM)によって構成される。
論文 参考訳(メタデータ) (2022-08-06T14:36:48Z) - Local Attention Graph-based Transformer for Multi-target Genetic
Alteration Prediction [0.22940141855172028]
MIL(LA-MIL)のための汎用ローカルアテンショングラフを用いたトランスフォーマを提案する。
LA-MILは消化器癌に対する突然変異予測において最先端の結果が得られることを実証した。
これは、局所的な自己保持がグローバルモジュールと同等の依存性を十分にモデル化していることを示唆している。
論文 参考訳(メタデータ) (2022-05-13T14:24:24Z) - Self-Guided Adaptation: Progressive Representation Alignment for Domain
Adaptive Object Detection [86.69077525494106]
非教師なしドメイン適応(UDA)は、オブジェクト検出モデルのドメイン間ロバスト性を改善するために前例のない成功を収めた。
既存のUDA手法は、モデル学習中の瞬間的なデータ分布を無視しており、大きなドメインシフトによって特徴表現が劣化する可能性がある。
本稿では、特徴表現の整合とドメイン間のオブジェクト検出モデルの転送を目標とする自己ガイド適応モデルを提案する。
論文 参考訳(メタデータ) (2020-03-19T13:30:45Z) - Q-GADMM: Quantized Group ADMM for Communication Efficient Decentralized Machine Learning [66.18202188565922]
我々はQGADMM(QGADMM)という通信効率の高い分散機械学習(ML)アルゴリズムを提案する。
我々は,凸関数に対するQGADMMの収束性を証明しつつ,モデル化レベルとその確率を適応的に調整する新しい量子化法を開発した。
論文 参考訳(メタデータ) (2019-10-23T10:47:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。