論文の概要: Inflated 3D Convolution-Transformer for Weakly-supervised Carotid
Stenosis Grading with Ultrasound Videos
- arxiv url: http://arxiv.org/abs/2306.02548v1
- Date: Mon, 5 Jun 2023 02:50:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 17:18:44.182380
- Title: Inflated 3D Convolution-Transformer for Weakly-supervised Carotid
Stenosis Grading with Ultrasound Videos
- Title(参考訳): 超音波画像による頸動脈狭窄の3次元インフレーション変換
- Authors: Xinrui Zhou, Yuhao Huang, Wufeng Xue, Xin Yang, Yuxin Zou, Qilong
Ying, Yuanji Zhang, Jia Liu, Jie Ren, Dong Ni
- Abstract要約: 自動頸動脈狭窄グレーディング(CSG)のための第1のビデオ分類フレームワークについて紹介する。
弱教師付きCSGのための新しい効果的な映像分類ネットワークを提案する。
本手法は,大容量の頸動脈ビデオデータセットで広く検証されている。
- 参考スコア(独自算出の注目度): 12.780908780402516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Localization of the narrowest position of the vessel and corresponding vessel
and remnant vessel delineation in carotid ultrasound (US) are essential for
carotid stenosis grading (CSG) in clinical practice. However, the pipeline is
time-consuming and tough due to the ambiguous boundaries of plaque and temporal
variation. To automatize this procedure, a large number of manual delineations
are usually required, which is not only laborious but also not reliable given
the annotation difficulty. In this study, we present the first video
classification framework for automatic CSG. Our contribution is three-fold.
First, to avoid the requirement of laborious and unreliable annotation, we
propose a novel and effective video classification network for
weakly-supervised CSG. Second, to ease the model training, we adopt an
inflation strategy for the network, where pre-trained 2D convolution weights
can be adapted into the 3D counterpart in our network. In this way, the
existing pre-trained large model can be used as an effective warm start for our
network. Third, to enhance the feature discrimination of the video, we propose
a novel attention-guided multi-dimension fusion (AMDF) transformer encoder to
model and integrate global dependencies within and across spatial and temporal
dimensions, where two lightweight cross-dimensional attention mechanisms are
designed. Our approach is extensively validated on a large clinically collected
carotid US video dataset, demonstrating state-of-the-art performance compared
with strong competitors.
- Abstract(参考訳): 臨床における頸動脈狭窄度(CSG)の診断には, 血管の最も狭い位置とそれに対応する血管と残存血管の脱線が不可欠である。
しかし、パイプラインは、プラークと時間的変動のあいまいな境界のため、時間がかかり、難しい。
この手順を自動化するには、多くの手作業による記述が必要になるが、これは手間がかかるだけでなく、アノテーションの難しさから信頼性も低い。
本研究では,CSGの自動分類のための最初のビデオ分類フレームワークを提案する。
私たちの貢献は3倍です。
まず, 冗長で信頼できないアノテーションの要求を避けるために, 弱教師付きcsgのための新しい効果的なビデオ分類ネットワークを提案する。
第二に、モデルのトレーニングを容易にするために、トレーニング済みの2D畳み込み重みをネットワーク内の3Dに適合させることができるネットワークのインフレーション戦略を採用する。
このように、既存の事前学習された大規模モデルは、ネットワークの効果的なウォームスタートとして使用できる。
第3に,2つの軽量な多次元アテンション機構を設計した空間的・時間的空間的・空間的相互依存をモデル化・統合するための,新しい注意誘導多次元フュージョン(AMDF)トランスフォーマエンコーダを提案する。
提案手法は,大容量の頸動脈ビデオデータセットで広く検証され,競合相手と比較して最先端の性能が示された。
関連論文リスト
- ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - TASL-Net: Tri-Attention Selective Learning Network for Intelligent Diagnosis of Bimodal Ultrasound Video [10.087796410298061]
本稿では,この課題に対処するための新しい3段階選択学習ネットワーク(TASL-Net)を提案する。
TASL-Netは、超音波ビデオのインテリジェント診断のための相互変換フレームワークに、ソノグラフィーの3種類の診断注意を組み込む。
肺,乳房,肝臓の3つのデータセット上でTASL-Netの性能を詳細に検証した。
論文 参考訳(メタデータ) (2024-09-03T02:50:37Z) - Epicardium Prompt-guided Real-time Cardiac Ultrasound Frame-to-volume Registration [50.602074919305636]
本稿では,CU-Reg と呼ばれる,軽量でエンドツーエンドなカード・ツー・エンド・超音波フレーム・ツー・ボリューム・レジストレーション・ネットワークを提案する。
2次元スパースと3次元濃密な特徴の相互作用を増強するために,心内膜急速ガイドによる解剖学的手がかりを用い,その後,強化された特徴のボクセル的局所グロバル集約を行った。
論文 参考訳(メタデータ) (2024-06-20T17:47:30Z) - DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy [5.8722774441994074]
リアルタイムビジュアルナビゲート気管支鏡(DD-VNB)のためのDepth-based Dual-Loopフレームワークを提案する。
DD-VNBフレームワークは、深さ推定とデュアルループローカライゼーションという2つの重要なモジュールを統合している。
患者からのファントムデータとin-vivoデータを用いた実験により,本フレームワークの有効性が示された。
論文 参考訳(メタデータ) (2024-03-04T02:29:02Z) - 3D Vascular Segmentation Supervised by 2D Annotation of Maximum
Intensity Projection [33.34240545722551]
血管構造のセグメンテーションは、医学的分析と臨床応用において重要な役割を担っている。
既存の弱監督法は, スパース血管構造を扱う際に, 最適下肢機能を示した。
ここでは,3次元体積の次元を2次元画像に変換するために,最大強度投影(MIP)を用いる。
MIPを介して2D-3Dの深い特徴を融合してセグメンテーション性能を向上させる弱教師付きネットワークを導入する。
論文 参考訳(メタデータ) (2024-02-19T13:24:46Z) - F3-Pruning: A Training-Free and Generalized Pruning Strategy towards
Faster and Finer Text-to-Video Synthesis [94.10861578387443]
変圧器と拡散モデルを用いた2つの主流T2Vモデルの推論過程について検討する。
本稿では、時間的余分な注意重みを突破するF3プルーニングと呼ばれるトレーニングフリーで一般化されたプルーニング戦略を提案する。
古典的なトランスフォーマーベースモデルCogVideoと典型的な拡散ベースモデルTune-A-Videoを用いた3つのデータセットの大規模な実験により、F3-Pruningの有効性が検証された。
論文 参考訳(メタデータ) (2023-12-06T12:34:47Z) - Focused Decoding Enables 3D Anatomical Detection by Transformers [64.36530874341666]
集束デコーダと呼ばれる3次元解剖学的構造検出のための新しい検出変換器を提案する。
Focused Decoderは、解剖学的領域のアトラスからの情報を活用して、クエリアンカーを同時にデプロイし、クロスアテンションの視野を制限する。
提案手法を利用可能な2つのCTデータセットに対して評価し、フォーカスドデコーダが強力な検出結果を提供するだけでなく、大量の注釈付きデータの必要性を軽減し、注意重みによる結果の例外的で直感的な説明性を示すことを示した。
論文 参考訳(メタデータ) (2022-07-21T22:17:21Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z) - Deep Q-Network-Driven Catheter Segmentation in 3D US by Hybrid
Constrained Semi-Supervised Learning and Dual-UNet [74.22397862400177]
本稿では,教師付き学習手法よりも少ないアノテーションを要求できる新しいカテーテルセグメンテーション手法を提案する。
提案手法では,Voxelレベルのアノテーションを避けるために,深層Q学習を事前局所化ステップとみなす。
検出されたカテーテルでは、パッチベースのDual-UNetを使用してカテーテルを3Dボリュームデータに分割する。
論文 参考訳(メタデータ) (2020-06-25T21:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。