論文の概要: Weakly Supervised Segmentation of Hyper-Reflective Foci with Compact Convolutional Transformers and SAM2
- arxiv url: http://arxiv.org/abs/2501.05933v1
- Date: Fri, 10 Jan 2025 12:56:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 15:27:23.348037
- Title: Weakly Supervised Segmentation of Hyper-Reflective Foci with Compact Convolutional Transformers and SAM2
- Title(参考訳): コンパクトな畳み込み変圧器とSAM2による超反射フォントの弱い修正
- Authors: Olivier Morelle, Justus Bisten, Maximilian W. M. Wintergerst, Robert P. Finger, Thomas Schultz,
- Abstract要約: 本稿では,従来の注意に基づくMIL(Multiple Instance Learning)アプローチの空間分解能を高める新しいフレームワークを提案する。
我々は,MILをCCT(Compact Convolutional Transformer)に置き換えることによって,セグメント化精度が大幅に向上することが実証された。
- 参考スコア(独自算出の注目度): 0.7340017786387767
- License:
- Abstract: Weakly supervised segmentation has the potential to greatly reduce the annotation effort for training segmentation models for small structures such as hyper-reflective foci (HRF) in optical coherence tomography (OCT). However, most weakly supervised methods either involve a strong downsampling of input images, or only achieve localization at a coarse resolution, both of which are unsatisfactory for small structures. We propose a novel framework that increases the spatial resolution of a traditional attention-based Multiple Instance Learning (MIL) approach by using Layer-wise Relevance Propagation (LRP) to prompt the Segment Anything Model (SAM~2), and increases recall with iterative inference. Moreover, we demonstrate that replacing MIL with a Compact Convolutional Transformer (CCT), which adds a positional encoding, and permits an exchange of information between different regions of the OCT image, leads to a further and substantial increase in segmentation accuracy.
- Abstract(参考訳): 弱教師付きセグメンテーションは、光コヒーレンストモグラフィー(OCT)において、超反射性ファシ(HRF)のような小さな構造に対するセグメンテーションモデルをトレーニングするためのアノテーションの労力を大幅に削減する可能性がある。
しかし、最も弱い教師付き手法は、入力画像の強いダウンサンプリングを伴うか、あるいは粗い解像度でのみローカライズされるかのいずれかであり、どちらも小さな構造には不満足である。
本稿では,レイヤワイド・レバレンス・プロパゲーション(LRP)を用いて,従来の注意に基づくMIL(Multiple Instance Learning)アプローチの空間分解能を高め,Segment Anything Model(SAM~2)を誘導し,反復推論によるリコールを増大させる新しいフレームワークを提案する。
さらに,MIL をコンパクト畳み込み変換器 (CCT) に置き換えることで,位置符号化を付加し,OCT 画像の異なる領域間での情報交換を可能にすることにより,セグメント化精度がさらに大きく向上することを示す。
関連論文リスト
- Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文 参考訳(メタデータ) (2023-11-30T05:15:35Z) - CCMR: High Resolution Optical Flow Estimation via Coarse-to-Fine
Context-Guided Motion Reasoning [1.0855602842179624]
マルチスケール光フロー推定に注目に基づく動きグルーピングの概念を活用する高分解能粗度アプローチであるCCMRを提案する。
CCMRは階層的な2段階の注意に基づく文脈移動グループ戦略に依存している。
実験と改善は、マルチスケールとアテンションに基づく概念を組み合わせる努力が報われることを示している。
論文 参考訳(メタデータ) (2023-11-05T14:14:24Z) - Low-Resolution Self-Attention for Semantic Segmentation [93.30597515880079]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - Improving Misaligned Multi-modality Image Fusion with One-stage
Progressive Dense Registration [67.23451452670282]
多モード画像間の相違は、画像融合の課題を引き起こす。
マルチスケールプログレッシブ・センス・レジストレーション方式を提案する。
このスキームは、一段階最適化のみで粗大な登録を行う。
論文 参考訳(メタデータ) (2023-08-22T03:46:24Z) - ESSAformer: Efficient Transformer for Hyperspectral Image
Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。
本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文 参考訳(メタデータ) (2023-07-26T07:45:14Z) - LLIC: Large Receptive Field Transform Coding with Adaptive Weights for Learned Image Compression [27.02281402358164]
学習画像圧縮のための適応重み付き大規模受容場変換符号化を提案する。
カーネルをベースとした奥行きに関する大規模な畳み込みを導入し,複雑さを抑えながら冗長性を向上する。
我々のLLICモデルは最先端のパフォーマンスを実現し、パフォーマンスと複雑さのトレードオフを改善する。
論文 参考訳(メタデータ) (2023-04-19T11:19:10Z) - IDEAL: Improved DEnse locAL Contrastive Learning for Semi-Supervised
Medical Image Segmentation [3.6748639131154315]
我々は,メートル法学習の概念をセグメンテーションタスクに拡張する。
本稿では,高密度画素レベルの特徴量を得るための単純な畳み込みプロジェクションヘッドを提案する。
下流タスクに対して,2ストリーム正規化トレーニングを含む双方向正規化機構を考案した。
論文 参考訳(メタデータ) (2022-10-26T23:11:02Z) - Deformer: Towards Displacement Field Learning for Unsupervised Medical
Image Registration [28.358693013757865]
本稿では,デフォルマブル画像登録タスクのためのマルチスケールフレームワークとともに,新しいデフォルマモジュールを提案する。
Deformerモジュールは、画像表現から空間変換へのマッピングを容易にするように設計されている。
粗い粒度で変位場を予測するマルチスケールの枠組みにより、優れた性能が得られる。
論文 参考訳(メタデータ) (2022-07-07T09:14:40Z) - Activation Modulation and Recalibration Scheme for Weakly Supervised
Semantic Segmentation [24.08326440298189]
弱教師付きセマンティックセグメンテーションのための新しいアクティベーション変調と再校正手法を提案する。
PASCAL VOC 2012データセット上で,AMRが新たな最先端パフォーマンスを確立することを示す。
また,本手法はプラグアンドプレイであり,他の手法と組み合わせて性能向上を図ることが可能であることを実験により明らかにした。
論文 参考訳(メタデータ) (2021-12-16T16:26:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。