論文の概要: 3D-LSPTM: An Automatic Framework with 3D-Large-Scale Pretrained Model for Laryngeal Cancer Detection Using Laryngoscopic Videos
- arxiv url: http://arxiv.org/abs/2409.01459v1
- Date: Mon, 2 Sep 2024 20:44:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 03:48:38.519591
- Title: 3D-LSPTM: An Automatic Framework with 3D-Large-Scale Pretrained Model for Laryngeal Cancer Detection Using Laryngoscopic Videos
- Title(参考訳): 3D-LSPTM:喉頭画像を用いた喉頭癌検診のための3D-LSPTMによる3D-Large-scale Pretrained Modelの自動フレームワーク
- Authors: Meiyu Qiu, Yun Li, Wenjun Huang, Haoyun Zhang, Weiping Zheng, Wenbin Lei, Xiaomao Fan,
- Abstract要約: 喉頭癌は耳鼻咽喉科において高い道徳率を有する悪性疾患であり、ヒトの健康に重大な脅威をもたらす。
伝統的に喉頭科医は喉頭内視鏡的ビデオで手動で喉頭癌を視認するが、それは非常に時間がかかり、主観的である。
喉頭癌検出のための3D-LSPTMと呼ばれる3次元大規模事前訓練モデルによる新しい枠組みを提案する。
- 参考スコア(独自算出の注目度): 4.368457767782616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Laryngeal cancer is a malignant disease with a high morality rate in otorhinolaryngology, posing an significant threat to human health. Traditionally larygologists manually visual-inspect laryngeal cancer in laryngoscopic videos, which is quite time-consuming and subjective. In this study, we propose a novel automatic framework via 3D-large-scale pretrained models termed 3D-LSPTM for laryngeal cancer detection. Firstly, we collect 1,109 laryngoscopic videos from the First Affiliated Hospital Sun Yat-sen University with the approval of the Ethics Committee. Then we utilize the 3D-large-scale pretrained models of C3D, TimeSformer, and Video-Swin-Transformer, with the merit of advanced featuring videos, for laryngeal cancer detection with fine-tuning techniques. Extensive experiments show that our proposed 3D-LSPTM can achieve promising performance on the task of laryngeal cancer detection. Particularly, 3D-LSPTM with the backbone of Video-Swin-Transformer can achieve 92.4% accuracy, 95.6% sensitivity, 94.1% precision, and 94.8% F_1.
- Abstract(参考訳): 喉頭癌は耳鼻咽喉科において高い道徳率を有する悪性疾患であり、ヒトの健康に重大な脅威をもたらす。
伝統的に喉頭科医は喉頭内視鏡的ビデオで手動で喉頭癌を視認するが、それは非常に時間がかかり、主観的である。
本研究では,喉頭癌検出のための3D-LSPTMと呼ばれる3次元大規模事前訓練モデルを用いた新しい自動フレームワークを提案する。
まず, 第一提携病院サンヤットセン大学から, 倫理委員会の承認を得て1,109本の喉頭鏡映像を収集した。
次に,C3D,TimeSformer,Video-Swin-Transformerの3次元大規模事前訓練モデルを用いて,喉頭癌検出のための微細調整技術を開発した。
今回提案した3D-LSPTMは喉頭癌検出の課題において有望な性能を発揮することが確認された。
特に、Video-Swin-Transformerのバックボーンを持つ3D-LSPTMは92.4%の精度、95.6%の感度、94.1%の精度、94.8%のF_1を達成することができる。
関連論文リスト
- Gaussian Pancakes: Geometrically-Regularized 3D Gaussian Splatting for Realistic Endoscopic Reconstruction [12.16045145984442]
現在の方法は、大腸表面の包括的かつ正確な3D再構成を提供することに苦慮している。
ガウス・パンケーキ(Gaussian Pancakes)は3次元ガウス・スティング(Gaussian Splatting, 3D GS)の手法である。
また,PSNRが18%向上し,SSIMが16%向上した。
また、100倍以上の高速レンダリングと10倍以上のトレーニング時間を提供し、リアルタイムアプリケーションに実用的なツールを提供する。
論文 参考訳(メタデータ) (2024-04-09T08:51:44Z) - Generative Enhancement for 3D Medical Images [74.17066529847546]
本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。
本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。
3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2024-03-19T15:57:04Z) - On the Localization of Ultrasound Image Slices within Point Distribution
Models [84.27083443424408]
甲状腺疾患は高分解能超音波(US)で診断されることが多い
縦断追跡は病理甲状腺形態の変化をモニタリングするための重要な診断プロトコルである。
3次元形状表現におけるUS画像の自動スライスローカライズのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-01T10:10:46Z) - Evaluating the Effectiveness of 2D and 3D Features for Predicting Tumor
Response to Chemotherapy [0.9709939410473847]
2Dと3Dの腫瘍の特徴は、様々な医療画像解析タスクで広く利用されている。
化学療法反応予測では, 異なる種類の2D特徴と3D特徴の相互効果は包括的に評価されない。
論文 参考訳(メタデータ) (2023-03-28T16:44:43Z) - Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。
従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。
これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。
本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:38:42Z) - Moving from 2D to 3D: volumetric medical image classification for rectal
cancer staging [62.346649719614]
術前T2期とT3期を区別することは直腸癌治療における最も困難かつ臨床的に重要な課題である。
直腸MRIでT3期直腸癌からT2を正確に判別するための体積畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-13T07:10:14Z) - Colonoscopy 3D Video Dataset with Paired Depth from 2D-3D Registration [1.1774995069145182]
大腸内視鏡におけるコンピュータビジョン手法のベンチマークのための3Dビデオデータセット(C3VD)を提案する。
そこで本研究では,光学ビデオシーケンスを,既知の3次元モデルの地上実写表示で登録するための,新しい2D-3D登録手法を提案する。
論文 参考訳(メタデータ) (2022-06-17T17:23:50Z) - The interpretation of endobronchial ultrasound image using 3D
convolutional neural network for differentiating malignant and benign
mediastinal lesions [3.0969191504482247]
本研究の目的は,内胚葉超音波(EBUS)画像を用いて悪性病変と良性病変を鑑別することである。
我々のモデルはノイズに耐性があり、EBUSビデオの様々な画像特徴と願望を融合させることができる。
論文 参考訳(メタデータ) (2021-07-29T08:38:17Z) - Automated Model Design and Benchmarking of 3D Deep Learning Models for
COVID-19 Detection with Chest CT Scans [72.04652116817238]
3D胸部CTスキャン分類のための3D DLモデルを自動的に検索するための差別化可能なニューラルネットワーク探索(DNAS)フレームワークを提案する。
また,我々のモデルのクラスアクティベーションマッピング(cam)技術を利用して,結果の解釈可能性を提供する。
論文 参考訳(メタデータ) (2021-01-14T03:45:01Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。