論文の概要: TexLiverNet: Leveraging Medical Knowledge and Spatial-Frequency Perception for Enhanced Liver Tumor Segmentation
- arxiv url: http://arxiv.org/abs/2411.04595v1
- Date: Thu, 07 Nov 2024 10:26:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-08 19:37:40.959514
- Title: TexLiverNet: Leveraging Medical Knowledge and Spatial-Frequency Perception for Enhanced Liver Tumor Segmentation
- Title(参考訳): TexLiverNet: 肝腫瘍分節増強のための医療知識の活用と空間周波数知覚
- Authors: Xiaoyan Jiang, Zhi Zhou, Hailing Wang, Guozhong Wang, Zhijun Fang,
- Abstract要約: 肝腫瘍に対する病変特異的テキストアノテーションを用いたデータセットを開発した。
TexLiverNetは、テキスト機能を視覚的特徴と効率的に統合するエージェントベースのクロスアテンションモジュールを使用している。
TexLiverNetは現在の最先端の手法よりも優れたパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 9.010735557140547
- License:
- Abstract: Integrating textual data with imaging in liver tumor segmentation is essential for enhancing diagnostic accuracy. However, current multi-modal medical datasets offer only general text annotations, lacking lesion-specific details critical for extracting nuanced features, especially for fine-grained segmentation of tumor boundaries and small lesions. To address these limitations, we developed datasets with lesion-specific text annotations for liver tumors and introduced the TexLiverNet model. TexLiverNet employs an agent-based cross-attention module that integrates text features efficiently with visual features, significantly reducing computational costs. Additionally, enhanced spatial and adaptive frequency domain perception is proposed to precisely delineate lesion boundaries, reduce background interference, and recover fine details in small lesions. Comprehensive evaluations on public and private datasets demonstrate that TexLiverNet achieves superior performance compared to current state-of-the-art methods.
- Abstract(参考訳): 診断精度を高めるためには,肝腫瘍セグメント化におけるテキストデータと画像の統合が不可欠である。
しかし、現在のマルチモーダル医療データセットは、一般的なテキストアノテーションのみを提供しており、ニュアンスな特徴の抽出、特に腫瘍境界の微細なセグメンテーションや小さな病変の抽出に欠如している。
これらの制約に対処するため,肝腫瘍の病変特異的テキストアノテーションを用いたデータセットを開発し,TexLiverNetモデルを導入した。
TexLiverNetはエージェントベースのクロスアテンションモジュールを使用し、テキスト機能を視覚的特徴と効率的に統合し、計算コストを大幅に削減する。
さらに、空間的および適応的な周波数領域知覚の強化は、病変の境界線を正確に切り離し、背景干渉を低減し、小さな病変の細部を回復するために提案される。
パブリックデータセットとプライベートデータセットの総合的な評価は、TexLiverNetが現在の最先端の手法よりも優れたパフォーマンスを実現していることを示している。
関連論文リスト
- Artificial Intelligence-Enhanced Couinaud Segmentation for Precision Liver Cancer Therapy [21.74576495152911]
本研究では,新しいCouinaudセグメンテーションモデルであるLiverFormerを紹介する。
LiverFormerはグローバルコンテキストと3DハイブリッドCNN-Transformerアーキテクチャに基づく低レベルのローカル機能を統合する。
論文 参考訳(メタデータ) (2024-11-05T05:27:03Z) - A Holistic Weakly Supervised Approach for Liver Tumor Segmentation with Clinical Knowledge-Informed Label Smoothing [17.798774864007505]
肝がんは世界中で死亡率の高い原因である。
ディープラーニングは、自動肝セグメンテーションを約束している。
これらの課題に対処する新しい全体的弱教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-13T20:52:25Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - Dynamic Graph Enhanced Contrastive Learning for Chest X-ray Report
Generation [92.73584302508907]
コントラスト学習を用いた医療レポート作成を支援するために,動的構造とノードを持つ知識グラフを提案する。
詳しくは、グラフの基本構造は一般知識から事前構築される。
各イメージ機能は、レポート生成のためにデコーダモジュールに入力する前に、独自の更新グラフに統合される。
論文 参考訳(メタデータ) (2023-03-18T03:53:43Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - A Global and Patch-wise Contrastive Loss for Accurate Automated Exudate
Detection [12.669734891001667]
糖尿病網膜症(DR:diabetic retinopathy)は、視覚障害の主要な原因である。
硬口蓋の早期発見は、糖尿病の治療と視力喪失の予防に役立つDRの同定において重要な役割を担っている。
ハード・エクスデュート・セグメンテーションを最適化する新しい教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-22T17:39:00Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - Weakly-Supervised Universal Lesion Segmentation with Regional Level Set
Loss [16.80758525711538]
高分解能ネットワーク(HRNet)に基づく新しい弱監督ユニバーサル病変分割法を提案する。
AHRNetはデコーダ、デュアルアテンション、スケールアテンション機構を含む高度な高解像度のディープイメージ機能を提供する。
本手法は,公開大規模deeplesionデータセットとホールドアウトテストセットにおいて,最高の性能を実現する。
論文 参考訳(メタデータ) (2021-05-03T23:33:37Z) - Belief function-based semi-supervised learning for brain tumor
segmentation [23.21410263735263]
ディープラーニングは、注釈付きデータを使用して病変フィールドを検出し、セグメンテーションすることを可能にする。
しかし、医療分野では、正確に注釈付きデータを取得することが非常に難しい。
本稿では,情報融合戦略を持つ新しい明示的ニューラルネットワークを用いて,不確実な境界問題に対処する。
論文 参考訳(メタデータ) (2021-01-29T22:39:16Z) - Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions
Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。
wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。
新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文 参考訳(メタデータ) (2020-12-08T02:26:03Z) - Inf-Net: Automatic COVID-19 Lung Infection Segmentation from CT Images [152.34988415258988]
CT画像からの肺感染症の自動検出は、新型コロナウイルスに対処するための従来の医療戦略を強化する大きな可能性を秘めている。
CTスライスから感染領域を分割することは、高い感染特性の変化、感染と正常な組織の間の低強度のコントラストなど、いくつかの課題に直面している。
これらの課題に対処するため, 胸部CTスライスから感染部位を自動的に同定する, 新型のCOVID-19 Deep Lung infection Network (Inf-Net) が提案されている。
論文 参考訳(メタデータ) (2020-04-22T07:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。