論文の概要: ZACH-ViT: A Zero-Token Vision Transformer with ShuffleStrides Data Augmentation for Robust Lung Ultrasound Classification
- arxiv url: http://arxiv.org/abs/2510.17650v1
- Date: Mon, 20 Oct 2025 15:26:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.501243
- Title: ZACH-ViT: A Zero-Token Vision Transformer with ShuffleStrides Data Augmentation for Robust Lung Ultrasound Classification
- Title(参考訳): ZACH-ViT:ロバスト肺超音波分類のためのShuffleStridesデータ拡張によるゼロトーケン・ビジョン変換器
- Authors: Athanasios Angelakis, Amne Mousa, Micah L. A. Heldeweg, Laurens A. Biesheuvel, Mark A. Haaksma, Jasper M. Smit, Pieter R. Tuinman, Paul W. G. Elbers,
- Abstract要約: 本稿では,ZACH-ViT (Zero- parameter Adaptive Compact Hierarchical Vision Transformer, 0.25 M-Hierarchical Vision Transformer)を導入する。
ZACH-ViTは、95人の重病患者の380のLUSビデオで、9つの最先端のベースラインに対して評価された。
ROC-AUC (0.80と0.79) は感度のバランス(0.60)と特異性(0.91)で最高評価と試験を達成し、全ての競合するモデルは簡単な分類に崩壊した。
- 参考スコア(独自算出の注目度): 0.7495002546468839
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Differentiating cardiogenic pulmonary oedema (CPE) from non-cardiogenic and structurally normal lungs in lung ultrasound (LUS) videos remains challenging due to the high visual variability of non-cardiogenic inflammatory patterns (NCIP/ARDS-like), interstitial lung disease, and healthy lungs. This heterogeneity complicates automated classification as overlapping B-lines and pleural artefacts are common. We introduce ZACH-ViT (Zero-token Adaptive Compact Hierarchical Vision Transformer), a 0.25 M-parameter Vision Transformer variant that removes both positional embeddings and the [CLS] token, making it fully permutation-invariant and suitable for unordered medical image data. To enhance generalization, we propose ShuffleStrides Data Augmentation (SSDA), which permutes probe-view sequences and frame orders while preserving anatomical validity. ZACH-ViT was evaluated on 380 LUS videos from 95 critically ill patients against nine state-of-the-art baselines. Despite the heterogeneity of the non-cardiogenic group, ZACH-ViT achieved the highest validation and test ROC-AUC (0.80 and 0.79) with balanced sensitivity (0.60) and specificity (0.91), while all competing models collapsed to trivial classification. It trains 1.35x faster than Minimal ViT (0.62M parameters) with 2.5x fewer parameters, supporting real-time clinical deployment. These results show that aligning architectural design with data structure can outperform scale in small-data medical imaging.
- Abstract(参考訳): 肺超音波(LUS)ビデオにおける心原性肺浮腫(CPE)と非心原性肺と構造的に正常な肺との鑑別は,非心原性炎症パターン(NCIP/ARDS様),間質性肺疾患,健康肺の高視認性のため,依然として困難である。
この異質性は、B線が重なり合うような自動分類を複雑にし、胸膜アーチファクトが一般的である。
我々はZACH-ViT(Zero-token Adaptive Compact Hierarchical Vision Transformer)を導入し、位置埋め込みと[CLS]トークンの両方を取り除き、完全に置換不変であり、整列されていない医用画像データに適している。
本稿では,ShuffleStrides Data Augmentation (SSDA)を提案する。
ZACH-ViTは、95人の重病患者の380のLUSビデオで、9つの最先端のベースラインに対して評価された。
非心原性基の不均一性にもかかわらず、ZACH-ViTはROC-AUC(0.80と0.79)と平衡感度(0.60)と特異性(0.91)で高い検証と試験を行った。
最小 ViT (0.62M パラメータ) よりも 1.35 倍速く、パラメータは 2.5 倍少なく、リアルタイムな臨床展開をサポートする。
これらの結果から,データ構造とアーキテクチャ設計の整合性は,小型データ医用画像のスケールに優れることが示された。
関連論文リスト
- A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Pretrained hybrid transformer for generalizable cardiac substructures segmentation from contrast and non-contrast CTs in lung and breast cancers [3.704003490598663]
放射線治療計画(RTP)のためのAI自動セグメンテーションは、トレーニングデータセットとは異なる特徴を持つ臨床ケースに適用した場合、劣化する可能性がある。
肺がんおよび乳癌患者の心下組織を分断するために, プレトレーニングしたトランスフォーマーをハイブリッドトランスフォーマー畳み込みネットワーク (HTN) に改良した。
HTNは, 画像, 患者特性の異なるCTからの心筋部分構造を, 確固たる精度(幾何学的, 線量的測定値)で示していた。
論文 参考訳(メタデータ) (2025-05-16T04:48:33Z) - PCMC-T1: Free-breathing myocardial T1 mapping with
Physically-Constrained Motion Correction [15.251935193140982]
自由呼吸T1マッピングにおける動作補正のための物理制約付きディープラーニングモデルであるPCMC-T1を紹介する。
信号減衰モデルをネットワークアーキテクチャに組み込んで、縦方向緩和軸に沿った物理的に楽観的な変形を促す。
論文 参考訳(メタデータ) (2023-08-22T08:50:38Z) - Self-supervised contrastive learning of echocardiogram videos enables
label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。
左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。
EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-23T19:17:26Z) - CAE-Transformer: Transformer-based Model to Predict Invasiveness of Lung
Adenocarcinoma Subsolid Nodules from Non-thin Section 3D CT Scans [36.093580055848186]
肺腺癌(LAUC)は近年最も多い疾患である。
肺結節の侵襲性に関するタイムリーかつ正確な知識は適切な治療計画をもたらし、不必要な手術や遅発手術のリスクを低減させる。
LAUCの浸潤度を評価し,予測するための主要な画像モダリティは胸部CTである。
本稿では、LAUCを分類するために、予測トランスフォーマーベースのフレームワーク「CAE-Transformer」を開発した。
論文 参考訳(メタデータ) (2021-10-17T04:37:24Z) - Multi-Slice Net: A novel light weight framework for COVID-19 Diagnosis [38.32234937094937]
本稿では,CTスキャンを用いた軽量な新型コロナウイルス診断フレームワークを提案する。
特徴抽出器として強力なバックボーンネットワークを用い,識別的スライスレベルの特徴を抽出する。
これらの特徴は、患者レベル診断を得るために、軽量ネットワークによって集約される。
論文 参考訳(メタデータ) (2021-08-09T02:46:11Z) - Lung Ultrasound Segmentation and Adaptation between COVID-19 and
Community-Acquired Pneumonia [0.17159130619349347]
深層ニューラルネットワークを用いた超音声的B線分割作業に着目する。
我々は、COVID-19とCAP肺超音波データの両方を用いて、ネットワークをトレーニングする。
いずれかのタイプの肺疾患を推測する際には、様々な臨床応用が期待できる。
論文 参考訳(メタデータ) (2021-08-06T14:17:51Z) - Quantification of pulmonary involvement in COVID-19 pneumonia by means
of a cascade oftwo U-nets: training and assessment on multipledatasets using
different annotation criteria [83.83783947027392]
本研究は、新型コロナウイルスの肺病変の同定、セグメント化、定量化のために人工知能(AI)を活用することを目的とする。
2つのU-netのカスケードをベースとした自動解析パイプラインLungQuantシステムを開発した。
LungQuantシステムにおけるCT-Severity Score(CT-SS)の精度も評価した。
論文 参考訳(メタデータ) (2021-05-06T10:21:28Z) - Rapid quantification of COVID-19 pneumonia burden from computed
tomography with convolutional LSTM networks [1.0072268949897432]
新型肺炎における肺病変の迅速定量と分化のための新しい完全自動化ディープラーニングフレームワークを提案する。
SARS-CoV-2の陽性逆転写ポリメラーゼ連鎖反応試験結果を有する197例のCTデータセット上で,この方法の性能を評価した。
論文 参考訳(メタデータ) (2021-03-31T22:09:14Z) - Segmentation of Pulmonary Opacification in Chest CT Scans of COVID-19
Patients [3.140265238474236]
胸部CT(CT)スキャンにおける肺不透明化パターンのセグメンテーションのためのオープンソースモデルについて検討した。
世界中の医療センターで663個の胸部CT検査を行った。
本研究の最適モデルは,テストセットで0.76オパシティ・インターセクション・オーバー・ユニオンスコアを達成し,ドメイン適応を成功させ,専門家の1.7%以内のオパシティの容積を予測する。
論文 参考訳(メタデータ) (2020-07-07T17:32:24Z) - Co-Heterogeneous and Adaptive Segmentation from Multi-Source and
Multi-Phase CT Imaging Data: A Study on Pathological Liver and Lesion
Segmentation [48.504790189796836]
我々は,新しいセグメンテーション戦略,コヘテロジネティック・アダプティブセグメンテーション(CHASe)を提案する。
本稿では,外見に基づく半スーパービジョン,マスクに基づく対向ドメイン適応,擬似ラベルを融合した多目的フレームワークを提案する。
CHASeは4.2% sim 9.4%$の範囲で、病理的な肝臓マスクDice-Sorensen係数をさらに改善することができる。
論文 参考訳(メタデータ) (2020-05-27T06:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。