論文の概要: Normal Guidance is what Attention Needs
- arxiv url: http://arxiv.org/abs/2605.27306v1
- Date: Tue, 26 May 2026 17:17:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.487916
- Title: Normal Guidance is what Attention Needs
- Title(参考訳): 通常のガイダンスは注意が必要なもの
- Authors: Ethan Harvey, Dennis Johan Loevlie, Michael C. Hughes,
- Abstract要約: 本稿では,学習者の注意分布を鐘状の曲線に追従する正則化手法を提案する。
我々は,注意に基づくMIL法とトランスフォーマーに基づくMIL法が,最先端技術よりもはるかに優れたスライスレベルのローカライゼーションを実現することを示す。
- 参考スコア(独自算出の注目度): 4.299364919356825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider training classifiers for 3D medical images using only one binary label for the entire volume rather than a label for each 2D slice. In such weakly supervised settings, can we learn accurate classifiers for slice-level predictions? Attention-based multiple instance learning (MIL) can produce an attention score for every slice. Yet recent work demonstrates that a simple center-focused baseline that ignores image content can outperform attention-based and transformer-based MIL at slice-level classification of 3D brain scans. We show this baseline also outperforms existing MIL at slice-level classification of thoracic and abdominal CT scans. Motivated by this baseline, we propose Normal Guidance, a regularization technique that encourages the learned attention distribution to follow a bell-shaped curve. Across three medical imaging datasets totaling over 4 million 2D slices, we show our Normal Guidance enables attention-based and transformer-based MIL methods to deliver significantly better slice-level localization than the state-of-the-art while remaining competitive at whole-scan classification.
- Abstract(参考訳): 本研究では,2次元スライス毎にラベルを付けるのではなく,ボリューム全体のバイナリラベルを1つだけ使用した3次元医用画像のトレーニング分類について検討する。
このような弱教師付き設定では、スライスレベルの予測のための正確な分類器を学べるだろうか?
注意に基づく多重インスタンス学習(MIL)は、スライス毎に注意スコアを生成することができる。
しかし最近の研究は、3D脳スキャンのスライスレベル分類において、画像の内容を無視した単純な中心中心ベースラインが注意ベースのMILと変圧器ベースのMILより優れていることを実証している。
胸部CT,腹部CTのスライスレベル分類では既存のMILよりも高い成績を示した。
このベースラインを動機として,学習した注意分布を鐘状の曲線に追従させる正規化手法である正規誘導法を提案する。
3つの医用画像データセットの合計2Dスライス数は400万を超えるが,本研究では注意に基づくMIL法とトランスフォーマーに基づくMIL法により,全スキャン分類における競争力を維持しながら,最先端のスライスレベルのローカライズを実現している。
関連論文リスト
- A Multi-Dataset Benchmark of Multiple Instance Learning for 3D Neuroimage Classification [3.4619884908473324]
3次元畳み込みニューラルネットワーク(CNN)は、CTおよびMRIスキャンを分類するための標準的なアプローチである。
最近の研究は、深層多重インスタンス学習(MIL)が3D脳スキャンのより効率的な代替手段である可能性を示唆している。
論文 参考訳(メタデータ) (2026-04-29T15:35:27Z) - RADA: Region-Aware Dual-encoder Auxiliary learning for Barely-supervised Medical Image Segmentation [33.17607546116405]
希少な教師付き学習は,数個のラベル付きスライスをボリューム毎に使用することで,アノテーションの負担を軽減する。
本稿では,新しい領域認識型デュアルエンコーダ補助学習パイプラインであるRADを提案する。
このフレームワークは、画像レベルのきめ細かい視覚特徴とテキストレベルのセマンティックガイダンスを組み合わせることで、地域対応のセマンティックインスペクションを提供する。
論文 参考訳(メタデータ) (2026-04-13T08:26:26Z) - DinoAtten3D: Slice-Level Attention Aggregation of DinoV2 for 3D Brain MRI Anomaly Classification [2.731729370870452]
医用画像の異常検出と分類は早期診断には重要であるが, 注釈付きデータ, クラス不均衡, 専門家によるラベル付けのコストが高いため, 依然として困難である。
本稿では,3次元画像異常分類に特化して,注目に基づくグローバルアグリゲーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-15T23:31:40Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - CORPS: Cost-free Rigorous Pseudo-labeling based on Similarity-ranking
for Brain MRI Segmentation [3.1657395760137406]
本稿では,新しいアトラスを用いた擬似ラベル法と3次元脳MRI分割のための3次元深部畳み込みニューラルネットワーク(DCNN)に基づく半教師付きセグメンテーションフレームワークを提案する。
実験により, 定性的, 定量的に比較して, 提案手法の優位性を示した。
論文 参考訳(メタデータ) (2022-05-19T14:42:49Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Learning Inductive Attention Guidance for Partially Supervised
Pancreatic Ductal Adenocarcinoma Prediction [73.96902906734522]
膵管腺癌(PDAC)は、アメリカ合衆国で3番目に多いがん死の原因である。
本稿では,全てのトレーニングデータに対して安価な画像レベルのアノテーションが提供され,それらのサブセットに対してのみ,コストのかかるvoxelアノテーションが利用可能となる,部分教師付き設定について考察する。
Inductive Attention Guidance Network (IAG-Net) を提案し、通常の/PDAC分類のためのグローバル画像レベルの分類器と半教師付きPDAC分類のためのローカルボクセルレベルの分類器を共同で学習する。
論文 参考訳(メタデータ) (2021-05-31T08:16:09Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z) - Deep Q-Network-Driven Catheter Segmentation in 3D US by Hybrid
Constrained Semi-Supervised Learning and Dual-UNet [74.22397862400177]
本稿では,教師付き学習手法よりも少ないアノテーションを要求できる新しいカテーテルセグメンテーション手法を提案する。
提案手法では,Voxelレベルのアノテーションを避けるために,深層Q学習を事前局所化ステップとみなす。
検出されたカテーテルでは、パッチベースのDual-UNetを使用してカテーテルを3Dボリュームデータに分割する。
論文 参考訳(メタデータ) (2020-06-25T21:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。