論文の概要: CSV-ViT: A Vision Transformer with the Variable-sized Cortical Supervertices for Detection of Alzheimer's Disease Pathologies
- arxiv url: http://arxiv.org/abs/2605.26514v1
- Date: Tue, 26 May 2026 03:57:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.60956
- Title: CSV-ViT: A Vision Transformer with the Variable-sized Cortical Supervertices for Detection of Alzheimer's Disease Pathologies
- Title(参考訳): CSV-ViT : アルツハイマー病診断のための可変大皮質上転を用いた視覚変換器
- Authors: Geonwoo Baek, Ikbeom Jang,
- Abstract要約: 脳皮質表面の深層学習は、データの球面トポロジーのために大きな課題に直面している。
最近の表面モデルでは、皮質表面データから学習が可能になっている。
本稿では、ROI保存型可変サイズのパッチ分割を行う皮質表面トークン化を提案する。
我々は,パディングとマスク対応パッチ埋め込みを用いた可変サイズパッチ耐性ビジョントランスであるCSVビジョントランス (CSV-ViT) を設計する。
- 参考スコア(独自算出の注目度): 0.8736715764535464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Confirming Alzheimer's disease (AD) typically relies on positron emission tomography (PET), which remains costly and invasive, motivating the use of structural MRI-based prescreening. Deep learning on non-Euclidean manifolds, particularly brain cortical surfaces, faces significant challenges due to the data's spherical topology. Recent surface models have enabled learning from cortical surface data; however, imposing face-based uniform patches often causes duplicate vertices at patch boundaries. In general, many surface-based models are limited in their awareness of the region of interest (ROI), which can result in non-cortical regions, such as the medial wall, being included. We propose a cortical surface tokenization that performs ROI-preserving, vertex-based, variable-sized patch partitioning. We refer to these cortical surface patches as cortical supervertices (CSVs). Building on this representation, we design the CSV Vision Transformer (CSV-ViT), a variable-size patch-tolerant Vision Transformer that uses padding and a mask-aware patch embedding. We used T1-weighted MRI and evaluated our framework by classifying AD-related status into three categories: AD diagnosis, amyloid positivity, and tau positivity. Across the experiments, CSV-ViT achieved higher classification performance than recent surface-based models. The results suggest that the proposed CSV-ViT may support MRI-based prediction of AD-related status prior to PET or CSF confirmation.
- Abstract(参考訳): アルツハイマー病(AD)の確認は一般的にポジトロン・エミッション・トモグラフィ(PET)に頼っている。
非ユークリッド多様体、特に脳皮質表面の深層学習は、データの球面トポロジーのために大きな課題に直面している。
最近の表面モデルでは、皮質表面データから学習が可能になっているが、顔ベースの均一なパッチを適用すれば、パッチ境界で重複した頂点が発生することが多い。
一般に、多くの表面モデルでは関心領域(ROI)に対する認識が制限されており、中壁などの非皮質領域が含められる可能性がある。
本稿では、ROI保存、頂点ベース、可変サイズのパッチパーティショニングを行う皮質表面トークン化を提案する。
今回,これらの皮質表面パッチをCSV(Cortical Supervertices)と呼ぶ。
この表現に基づいて,パディングとマスク対応パッチ埋め込みを用いた可変サイズパッチ耐性ビジョントランスであるCSVビジョントランス (CSV-ViT) を設計する。
我々は,T1強調MRIを用いてAD関連状態をAD診断,アミロイド陽性,タウ陽性の3つのカテゴリに分類し,その枠組みを評価した。
実験全体を通して、CSV-ViTは最近の表面モデルよりも高い分類性能を達成した。
CSV-ViT は PET や CSF の確認に先立ってMRI による AD 関連状態の予測をサポートする可能性が示唆された。
関連論文リスト
- Improved Multiscale Structural Mapping with Supervertex Vision Transformer for the Detection of Alzheimer's Disease Neurodegeneration [0.7773571879033719]
アルツハイマー病(AD)の診断はポジトロン・エミッション・トモグラフィ(PET)や脳脊髄液(CSF)分析に依存することが多い。
非侵襲的ADスクリーニングには、CTなどの構造的MRIバイオマーカーが広く用いられている。
表面スーパーバーテックスマッピング(SSVM)とスーパーバーテックスビジョントランス(SV-ViT)を併用したMSSM+を提案する。
論文 参考訳(メタデータ) (2026-04-16T10:15:22Z) - Learning to Synergize Semantic and Geometric Priors for Limited-Data Wheat Disease Segmentation [51.06355116973389]
本研究では,小麦病のセグメンテーションを病種特異的な意味認識と疾患境界の局所化の複合的課題として扱う枠組みを提案する。
我々の中核的な洞察は、事前訓練されたDINOv2は、出現シフトを処理するために、堅牢なカテゴリ認識セマンティックスを提供します。
SGPer は,コムギ病と臓器分画のベンチマークにおいて,常に最先端のパフォーマンスを達成している。
論文 参考訳(メタデータ) (2026-04-07T04:19:39Z) - $MV_{Hybrid}$: Improving Spatial Transcriptomics Prediction with Hybrid State Space-Vision Transformer Backbone in Pathology Vision Foundation Models [2.145454038929631]
ビジョントランスフォーマー(ViT)のバックボーンをベースとした病理学における現在のビジョン基礎モデル(VFM)は、臨床基準以下である。
状態空間モデル(SSM)とViTを組み合わせたハイブリッドバックボーンアーキテクチャであるMV_Hybrid$を紹介する。
LOSO評価では、$MV_Hybrid$57%高い相関性を示し、性能劣化は43%小さい。
論文 参考訳(メタデータ) (2025-08-01T07:23:45Z) - From Saliency to DINO: Saliency-guided Vision Transformer for Few-shot
Keypoint Detection [36.9781808268263]
FSKD(Few-shot Keypoint Detection)は、参照サンプルに応じて、新規またはベースキーポイントを含むキーポイントをローカライズする。
FSKDは、ユビキタスノイズと曖昧な局所パターンを克服するために、キーポイント類似性学習に意味論的に意味のある関係を必要とする。
数発のキーポイント検出のための新しいサリエンシ誘導型視覚変換器であるSalViTを提案する。
論文 参考訳(メタデータ) (2023-04-06T15:22:34Z) - Modeling Barrett's Esophagus Progression using Geometric Variational Autoencoders [6.72834963752212]
バレット食道(BE)の早期発見は食道癌を効果的に予防し治療するために重要である。
S-VAEとShape Kendall VAEは,分類精度,再構成損失,生成能力の向上を示した。
論文 参考訳(メタデータ) (2023-03-17T14:08:16Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - FetReg: Placental Vessel Segmentation and Registration in Fetoscopy
Challenge Dataset [57.30136148318641]
Fetoscopy Laser Photocoagulation はツイン・ツー・ツイン・トランスフュージョン症候群(TTTS)の治療に広く用いられている治療法である
これにより、プロシージャ時間と不完全アブレーションが増加し、持続的なTTTSが生じる可能性がある。
コンピュータ支援による介入は、ビデオモザイクによって胎児の視野を広げ、船体ネットワークのより良い視覚化を提供することによって、これらの課題を克服するのに役立つかもしれない。
本稿では,長期フェトスコープビデオからドリフトフリーモザイクを作成することを目的とした,胎児環境のための汎用的でロバストなセマンティックセマンティックセグメンテーションとビデオモザイクアルゴリズムを開発するための大規模マルチセントデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。