論文の概要: How Close Are We? Limitations and Progress of AI Models in Banff Lesion Scoring
- arxiv url: http://arxiv.org/abs/2510.27158v1
- Date: Fri, 31 Oct 2025 04:07:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:15.973957
- Title: How Close Are We? Limitations and Progress of AI Models in Banff Lesion Scoring
- Title(参考訳): どれくらい近いのか?バンフレンションスコーリングにおけるAIモデルの限界と進歩
- Authors: Yanfan Zhu, Juming Xiong, Ruining Deng, Yu Wang, Yaohong Wang, Shilin Zhao, Mengmeng Yin, Yuqing Liu, Haichun Yang, Yuankai Huo,
- Abstract要約: 既存のディープラーニングモデルを用いて,Banff病変スコアの近似の可能性を検討する。
各Banffインジケータを構成成分と炎症成分に分解する。
本研究は, 構造欠失, 幻覚, 発見のあいまいさなど, 部分的成功と臨界障害モードの両方を強調した。
- 参考スコア(独自算出の注目度): 7.656903726908644
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Banff Classification provides the global standard for evaluating renal transplant biopsies, yet its semi-quantitative nature, complex criteria, and inter-observer variability present significant challenges for computational replication. In this study, we explore the feasibility of approximating Banff lesion scores using existing deep learning models through a modular, rule-based framework. We decompose each Banff indicator - such as glomerulitis (g), peritubular capillaritis (ptc), and intimal arteritis (v) - into its constituent structural and inflammatory components, and assess whether current segmentation and detection tools can support their computation. Model outputs are mapped to Banff scores using heuristic rules aligned with expert guidelines, and evaluated against expert-annotated ground truths. Our findings highlight both partial successes and critical failure modes, including structural omission, hallucination, and detection ambiguity. Even when final scores match expert annotations, inconsistencies in intermediate representations often undermine interpretability. These results reveal the limitations of current AI pipelines in replicating computational expert-level grading, and emphasize the importance of modular evaluation and computational Banff grading standard in guiding future model development for transplant pathology.
- Abstract(参考訳): バンフ分類(Banff Classification)は、腎移植生検の国際標準を提供するが、その半定量的性質、複雑な基準、およびサーバ間変動性は、計算レプリケーションにおいて重要な課題である。
本研究では,モジュール型ルールベースフレームワークを用いて,既存のディープラーニングモデルを用いたBanff病変スコアの近似の可能性について検討する。
本研究は, 各バンフ指標(g), 尿細管内毛細血管炎(ptc), 内膜動脈炎(v)など)を構成成分, 炎症成分に分解し, 現在のセグメンテーションと検出ツールがそれらの計算に有効かどうかを評価する。
モデルアウトプットは、専門家のガイドラインに沿ったヒューリスティックなルールを使用して、Banffスコアにマッピングされ、専門家が注釈を付けた真実に対して評価される。
本研究は, 構造欠失, 幻覚, 発見のあいまいさなど, 部分的成功と臨界障害モードの両方を強調した。
最終的なスコアが専門家のアノテーションと一致しても、中間表現の不整合はしばしば解釈可能性を妨げる。
これらの結果は、計算専門家レベルのグレーディングを複製する際の現在のAIパイプラインの限界を明らかにし、移植病理の将来のモデル開発を導く上で、モジュール評価と計算バンフグレーディング標準の重要性を強調している。
関連論文リスト
- PathoHR: Hierarchical Reasoning for Vision-Language Models in Pathology [3.459714932882085]
現在の視覚言語(VL)モデルは、構造化された病理報告の解釈に必要な複雑な推論を捉えるのに苦労することが多い。
病理領域内での階層的意味理解と構成的推論におけるVLモデルの能力を評価するために設計された新しいベンチマークであるPathoHR-Benchを提案する。
さらに、マルチモーダルコントラスト学習のための拡張および摂動サンプルを生成する、病理特異的なVLトレーニングスキームを導入する。
論文 参考訳(メタデータ) (2025-09-07T15:42:38Z) - AdaFusion: Prompt-Guided Inference with Adaptive Fusion of Pathology Foundation Models [49.550545038402184]
本稿では,新しいプロンプト誘導推論フレームワークであるAdaFusionを提案する。
本手法は,多様なモデルからタイルレベルの特徴を圧縮・整列する。
AdaFusionは、分類タスクと回帰タスクの両方にわたって、個々のPFMを一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:09:31Z) - Do Segmentation Models Understand Vascular Structure? A Blob-Based XAI Framework [0.3277163122167433]
深層学習モデルは、医用画像のセグメンテーションにおいて素晴らしいパフォーマンスを達成したが、そのブラックボックスの性質は臨床応用を制限している。
本稿では,勾配に基づく属性とグラフ誘導点選択を組み合わせた3次元血管セグメンテーションのための新しい説明可能性パイプラインを提案する。
本研究は,構造的説明可能性ツールの重要性を概説し,大域的血管コンテキストの把握におけるセグメンテーションモデルの限界を浮き彫りにした。
論文 参考訳(メタデータ) (2025-04-11T12:42:52Z) - Pitfalls of topology-aware image segmentation [81.19923502845441]
我々は、不適切な接続選択、見過ごされたトポロジカルアーティファクト、評価指標の不適切な使用を含むモデル評価における致命的な落とし穴を同定する。
本稿では,トポロジを意識した医用画像分割手法の公正かつ堅牢な評価基準を確立するための,行動可能なレコメンデーションセットを提案する。
論文 参考訳(メタデータ) (2024-12-19T08:11:42Z) - The Topology-Overlap Trade-Off in Retinal Arteriole-Venule Segmentation [0.0]
畳み込みニューラルネットワークは 予測と専門家のアノテーションの 高い重複を達成できる
オーバーラップの観点から,本モデルが最先端技術と同等の結果を得られることを示す。
論文 参考訳(メタデータ) (2023-03-31T13:01:05Z) - Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral
Fracture Grading [72.45699658852304]
本稿では,教師なし特徴抽出器として生成拡散オートエンコーダモデルを訓練するための新しい手法を提案する。
フラクチャーグレーディングを連続回帰としてモデル化し, フラクチャーのスムーズな進行を反映した。
重要なことに,本手法の創成特性は,与えられた脊椎の様々な段階を可視化し,自動グルーピングに寄与する特徴を解釈し,洞察することを可能にする。
論文 参考訳(メタデータ) (2023-03-21T17:16:01Z) - Learning $\mathbf{\mathit{Matching}}$ Representations for Individualized
Organ Transplantation Allocation [98.43063331640538]
臓器アロケーションと移植結果の観察データを用いて,臓器マッチングのためのデータ駆動型ルールの学習問題を定式化する。
本稿では,表現学習に基づくモデルを提案し,ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ドナー/ド
本モデルは,ヒトの専門家が実施する最先端のアロケーション手法やポリシーより優れる。
論文 参考訳(メタデータ) (2021-01-28T01:33:21Z) - A Teacher-Student Framework for Semi-supervised Medical Image
Segmentation From Mixed Supervision [62.4773770041279]
そこで我々は,臓器と病変のセグメンテーションのための教師と学生のスタイルに基づくセミ教師付き学習フレームワークを開発した。
我々は,本モデルがバウンディングボックスの品質に対して堅牢であることを示し,フル教師付き学習手法と比較した性能を実現する。
論文 参考訳(メタデータ) (2020-10-23T07:58:20Z) - Structural Causal Models Are (Solvable by) Credal Networks [70.45873402967297]
因果推論は、干潟網の更新のための標準的なアルゴリズムによって得ることができる。
この貢献は, 干潟ネットワークによる構造因果モデルを表現するための体系的なアプローチと見なされるべきである。
実験により, 実規模問題における因果推論には, クレーダルネットワークの近似アルゴリズムがすぐに利用できることがわかった。
論文 参考訳(メタデータ) (2020-08-02T11:19:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。