論文の概要: LQ-Adapter: ViT-Adapter with Learnable Queries for Gallbladder Cancer Detection from Ultrasound Image
- arxiv url: http://arxiv.org/abs/2412.00374v1
- Date: Sat, 30 Nov 2024 06:51:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:46:01.194615
- Title: LQ-Adapter: ViT-Adapter with Learnable Queries for Gallbladder Cancer Detection from Ultrasound Image
- Title(参考訳): LQ-Adapter:VT-Adapter with Learnable Queries for Gallbladder Cancer Detection from Ultrasound Image
- Authors: Chetan Madan, Mayuna Gupta, Soumen Basu, Pankaj Gupta, Chetan Arora,
- Abstract要約: 超音波(US)画像からの胆嚢癌(GBC)検出の問題点に着目する。
この問題は、ノイズ、テクスチャ、視点の変化に起因する画像品質の低下により、現代のディープニューラルネットワーク(DNN)技術に固有の課題をもたらす。
基本空間先行モジュール上で学習可能なコンテンツクエリを活用することで、ローカライズ情報を改善する。
- 参考スコア(独自算出の注目度): 7.76606060260265
- License:
- Abstract: We focus on the problem of Gallbladder Cancer (GBC) detection from Ultrasound (US) images. The problem presents unique challenges to modern Deep Neural Network (DNN) techniques due to low image quality arising from noise, textures, and viewpoint variations. Tackling such challenges would necessitate precise localization performance by the DNN to identify the discerning features for the downstream malignancy prediction. While several techniques have been proposed in the recent years for the problem, all of these methods employ complex custom architectures. Inspired by the success of foundational models for natural image tasks, along with the use of adapters to fine-tune such models for the custom tasks, we investigate the merit of one such design, ViT-Adapter, for the GBC detection problem. We observe that ViT-Adapter relies predominantly on a primitive CNN-based spatial prior module to inject the localization information via cross-attention, which is inefficient for our problem due to the small pathology sizes, and variability in their appearances due to non-regular structure of the malignancy. In response, we propose, LQ-Adapter, a modified Adapter design for ViT, which improves localization information by leveraging learnable content queries over the basic spatial prior module. Our method surpasses existing approaches, enhancing the mean IoU (mIoU) scores by 5.4%, 5.8%, and 2.7% over ViT-Adapters, DINO, and FocalNet-DINO, respectively on the US image-based GBC detection dataset, and establishing a new state-of-the-art (SOTA). Additionally, we validate the applicability and effectiveness of LQ-Adapter on the Kvasir-Seg dataset for polyp detection from colonoscopy images. Superior performance of our design on this problem as well showcases its capability to handle diverse medical imaging tasks across different datasets. Code is released at https://github.com/ChetanMadan/LQ-Adapter
- Abstract(参考訳): 超音波(US)画像からの胆嚢癌(GBC)検出の問題点に着目する。
この問題は、ノイズ、テクスチャ、視点の変化に起因する画像品質の低下により、現代のディープニューラルネットワーク(DNN)技術に固有の課題をもたらす。
このような課題に対処するには、下流悪性度予測の識別機能を特定するために、DNNによる正確なローカライゼーション性能が必要である。
近年、この問題に対していくつかのテクニックが提案されているが、これらの手法はすべて複雑なカスタムアーキテクチャを採用している。
自然画像タスクの基盤モデルの成功に触発され、カスタムタスクにそのようなモデルを微調整するためのアダプタの使用とともに、GBC検出問題に対する1つのViT-Adapterの有効性について検討した。
我々は,VT-Adapterが初期CNNベースの空間事前モジュールに大きく依存して位置情報を注入することが観察された。
提案するLQ-Adapterは,空間先行モジュール上で学習可能なコンテンツクエリを活用することで,ローカライズ情報を改善する。
提案手法は既存のアプローチを超越し,VT-Adapters,DINO,FocalNet-DINOに対して平均IoU(mIoU)スコアを5.4%,5.8%,2.7%向上させ,新たな最先端(SOTA)を確立した。
さらに,大腸内視鏡画像からのポリープ検出のためのKvasir-Segデータセットに対するLQ-Adapterの適用性と有効性を検討した。
この問題に対する私たちの設計の優れたパフォーマンスは、さまざまなデータセットにまたがる多様な医療画像タスクを処理できる能力を示している。
Codeはhttps://github.com/ChetanMadan/LQ-Adapterでリリースされる
関連論文リスト
- Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Gall Bladder Cancer Detection from US Images with Only Image Level
Labels [7.89876701812201]
画像レベルラベルのみを用いた胆嚢癌(GBC)の検出に着目する。
GBC検出のための標準画像分類モデルを訓練することは困難である。
トレーニング用にバウンディングボックスアノテーションは使用できないため、弱い教師付きオブジェクト検出として問題に対処する。
論文 参考訳(メタデータ) (2023-09-11T06:37:12Z) - Local Distortion Aware Efficient Transformer Adaptation for Image
Quality Assessment [62.074473976962835]
局所歪み特性を適切に注入することにより、IQAタスクにおいて、より大きな事前訓練および固定された基礎モデルがより優れた性能を発揮することを示す。
具体的には、局所歪み構造と視覚変換器(ViT)の誘導バイアスの欠如に対して、別の事前学習畳み込みニューラルネットワーク(CNN)を用いる。
本研究では, 予め訓練したCNNから局所歪み特徴を得るための局所歪み抽出器と, 局所歪み特徴をViTに注入する局所歪み注入器を提案する。
論文 参考訳(メタデータ) (2023-08-23T08:41:21Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Surpassing the Human Accuracy: Detecting Gallbladder Cancer from USG
Images with Curriculum Learning [17.694219750908413]
超音波(USG)画像からの胆嚢癌検出のためのCNNモデルの可能性について検討する。
USGは低コストとアクセシビリティのため、GB病で最も一般的な診断法である。
我々はGBCNetを提案し,その課題に対処する。
論文 参考訳(メタデータ) (2022-04-25T04:43:33Z) - Anomaly Detection in Retinal Images using Multi-Scale Deep Feature
Sparse Coding [30.097208168480826]
本稿では,網膜画像の異常検出のための教師なしアプローチを導入し,この問題を克服する。
我々は,Eye-Q,IDRiD,OCTIDデータセット上での最先端のSPADEに対して,AUCスコアが7.8%,6.7%,12.1%向上した。
論文 参考訳(メタデータ) (2022-01-27T13:36:22Z) - Stain Normalized Breast Histopathology Image Recognition using
Convolutional Neural Networks for Cancer Detection [9.826027427965354]
近年の進歩により、畳み込みニューラルネットワーク(CNN)アーキテクチャは乳がん検出のためのコンピュータ支援診断(CAD)システムの設計に利用できることが示されている。
乳腺病理像の2値分類のためのCNNモデルについて検討した。
我々は,200倍,400倍に拡大した病理像に対して,トレーニング済みのCNNネットワークを利用可能なBreaKHisデータセットで検証した。
論文 参考訳(メタデータ) (2022-01-04T03:09:40Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z) - Multiscale Detection of Cancerous Tissue in High Resolution Slide Scans [0.0]
高分解能スライドスキャンにおけるマルチスケール腫瘍(キメラ細胞)検出アルゴリズムを提案する。
提案手法では,CNNの異なる層における有効受容場を改良し,幅広いスケールの物体を1つの前方通過で検出する。
論文 参考訳(メタデータ) (2020-10-01T18:56:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。