論文の概要: VL-OrdinalFormer: Vision Language Guided Ordinal Transformers for Interpretable Knee Osteoarthritis Grading
- arxiv url: http://arxiv.org/abs/2601.00879v1
- Date: Wed, 31 Dec 2025 03:01:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.818136
- Title: VL-OrdinalFormer: Vision Language Guided Ordinal Transformers for Interpretable Knee Osteoarthritis Grading
- Title(参考訳): VL-OrdinalFormer: 変形性膝関節症に対する視覚言語ガイド
- Authors: Zahid Ullah, Jihie Kim,
- Abstract要約: VLOrdinalFormerは、膝関節X線写真から自動 KOA グレーティングを行うための視覚言語ガイド付き順序学習フレームワークである。
提案手法は,VT L16バックボーンとコーラルに基づく順序回帰と,CLIP(Contrastive Language Image Pretraining)によるセマンティックアライメントモジュールを組み合わせたものである。
OAI kneeKL224データセットで実施された実験は、VLOrdinalFormerがアートパフォーマンスの状態を達成していることを示している。
- 参考スコア(独自算出の注目度): 6.106307107513728
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knee osteoarthritis (KOA) is a leading cause of disability worldwide, and accurate severity assessment using the Kellgren Lawrence (KL) grading system is critical for clinical decision making. However, radiographic distinctions between early disease stages, particularly KL1 and KL2, are subtle and frequently lead to inter-observer variability among radiologists. To address these challenges, we propose VLOrdinalFormer, a vision language guided ordinal learning framework for fully automated KOA grading from knee radiographs. The proposed method combines a ViT L16 backbone with CORAL based ordinal regression and a Contrastive Language Image Pretraining (CLIP) driven semantic alignment module, allowing the model to incorporate clinically meaningful textual concepts related to joint space narrowing, osteophyte formation, and subchondral sclerosis. To improve robustness and mitigate overfitting, we employ stratified five fold cross validation, class aware re weighting to emphasize challenging intermediate grades, and test time augmentation with global threshold optimization. Experiments conducted on the publicly available OAI kneeKL224 dataset demonstrate that VLOrdinalFormer achieves state of the art performance, outperforming CNN and ViT baselines in terms of macro F1 score and overall accuracy. Notably, the proposed framework yields substantial performance gains for KL1 and KL2 without compromising classification accuracy for mild or severe cases. In addition, interpretability analyses using Grad CAM and CLIP similarity maps confirm that the model consistently attends to clinically relevant anatomical regions. These results highlight the potential of vision language aligned ordinal transformers as reliable and interpretable tools for KOA grading and disease progression assessment in routine radiological practice.
- Abstract(参考訳): 変形性膝関節症(KOA)は世界中の障害の主要な原因であり,Kelgren Lawrence(KL)グレーティングシステムを用いた重症度評価は臨床的意思決定に重要である。
しかし、初期の病期、特にKL1とKL2のX線学的区別は微妙であり、しばしば放射線学者の間でのサーバ間変動を引き起こす。
これらの課題に対処するために,膝関節X線写真からのKOAの完全自動評価のための視覚言語ガイド付き順序学習フレームワークであるVLOrdinalFormerを提案する。
提案手法は、VT L16バックボーンとコーラルに基づく順序回帰と、CLIP(Contrastive Language Image Pretraining)駆動のセマンティックアライメントモジュールを組み合わせることで、関節空間狭義、骨芽細胞形成、軟骨下硬化症に関連する臨床的に意味のあるテキストの概念を組み込むことができる。
強靭性の向上とオーバーフィッティングの軽減を目的として, 階層化された5倍のクロスバリデーション, クラス認識の重み付け, 挑戦的な中間グレードの強調, グローバルしきい値最適化によるテスト時間増強を行った。
OAI kneeKL224データセットで実施された実験は、VLOrdinalFormerが最先端のパフォーマンスを実現し、マクロF1スコアと全体的な精度でCNNとViTのベースラインを上回っていることを示している。
特に,本フレームワークでは,軽度または重度症例の分類精度を損なうことなく,KL1とKL2の大幅な性能向上を実現している。
さらに,Grad CAMとCLIPの類似性マップを用いた解釈可能性解析により,臨床解剖学的領域への連続的関与が確認された。
これらの結果は,日常的な放射線治療におけるKOAグレーディングと疾患進展評価のための信頼性と解釈可能なツールとして,視覚言語対応オーディナルトランスフォーマーの可能性を強調した。
関連論文リスト
- A Graph-Augmented knowledge Distillation based Dual-Stream Vision Transformer with Region-Aware Attention for Gastrointestinal Disease Classification with Explainable AI [0.06372261626436675]
本研究は,教師-学生の知識蒸留に基づくハイブリッド二流深層学習フレームワークを提案する。
教師のセマンティックな知識と形態的知識を継承するコンパクトなTiny-ViT構造として学生ネットワークが実装された。
主要なGI疾患クラスを含む2つの注意深くキュレートされたWireless Capsule Endoscopyデータセットを使用して、バランスの取れた表現を保証した。
論文 参考訳(メタデータ) (2025-12-24T07:51:54Z) - TWLR: Text-Guided Weakly-Supervised Lesion Localization and Severity Regression for Explainable Diabetic Retinopathy Grading [9.839282449612513]
糖尿病網膜症(DR)を診断するための2段階の枠組みであるTWLRを提案する。
第1段階では、視覚監督モデルがドメイン固有の眼科知識をテキスト埋め込みに統合し、DRグレーディングと病変分類を共同で行う。
第2段階では、弱言語セマンティックセグメンテーションに基づく反復重大度回帰フレームワークが導入されている。
論文 参考訳(メタデータ) (2025-12-15T06:08:16Z) - Stacked Ensemble of Fine-Tuned CNNs for Knee Osteoarthritis Severity Grading [4.278354829803626]
変形性膝関節症 (KOA) は, 日常活動において大きな限界と障害を生じさせる筋骨格疾患である。
KOAを評価するために、損傷した膝のX線画像を分析し、Kelgren-Lawrence(KL)グレーディングシステムに基づいてグレードを割り当てる。
微調整畳み込みニューラルネットワーク(CNN)の重畳アンサンブルモデルを開発した。
論文 参考訳(メタデータ) (2025-11-27T06:20:09Z) - MeCaMIL: Causality-Aware Multiple Instance Learning for Fair and Interpretable Whole Slide Image Diagnosis [40.3028468133626]
MIL(Multiple Case Learning)は、コンピュータ病理学における全スライド画像(WSI)解析の主流パラダイムとして登場した。
因果関係を意識したMILフレームワークである textbfMeCaMIL は、構造化因果グラフを通じて、階層的共同創設者を明示的にモデル化する。
MeCaMILは優れた公正性を達成する -- 人口格差の分散は、属性全体の平均で65%以上減少する。
論文 参考訳(メタデータ) (2025-11-14T06:47:21Z) - EndoCIL: A Class-Incremental Learning Framework for Endoscopic Image Classification [5.574295682041076]
内視鏡画像解析のためのクラスインクリメンタルラーニング(CIL)は,臨床応用に不可欠である。
本稿では,内視鏡的画像診断に適した新しい統合型CILフレームワークであるEndoCILを提案する。
論文 参考訳(メタデータ) (2025-10-20T06:26:54Z) - A Foundation Model for Chest X-ray Interpretation with Grounded Reasoning via Online Reinforcement Learning [41.27625400846057]
DeepMedix-R1は、胸部X線(CXR)の解釈のための総合医療用FMである。
クエリ毎に、画像のローカルリージョンに関連付けられた回答と推論ステップの両方を生成する。
論文 参考訳(メタデータ) (2025-09-04T06:00:04Z) - Fairness Evolution in Continual Learning for Medical Imaging [47.52603262576663]
本研究では、ドメイン固有の公平度指標を用いてタスク間でバイアスがどのように進化し、異なるCL戦略がこの進化にどのように影響するかを検討する。
以上の結果から,擬似ラベルと擬似ラベルの学習は最適分類性能を実現するが,擬似ラベルの偏りは小さいことが示唆された。
論文 参考訳(メタデータ) (2024-04-10T09:48:52Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Confidence-Driven Deep Learning Framework for Early Detection of Knee Osteoarthritis [8.193689534916988]
膝関節症 (KOA) は筋骨格障害の1つで、運動量や生活の質に深刻な影響を及ぼす。
我々は,KL-0およびKL-2ステージの識別に焦点をあてた,早期のKOA検出のための信頼性駆動型ディープラーニングフレームワークを提案する。
実験により,提案フレームワークは専門家の放射線学者に匹敵する,競争精度,感度,特異性を達成できることが示された。
論文 参考訳(メタデータ) (2023-03-23T11:57:50Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。