論文の概要: Detecting Performance Degradation under Data Shift in Pathology Vision-Language Model
- arxiv url: http://arxiv.org/abs/2601.00716v1
- Date: Fri, 02 Jan 2026 15:12:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.594589
- Title: Detecting Performance Degradation under Data Shift in Pathology Vision-Language Model
- Title(参考訳): 病理ビジョンランゲージモデルにおけるデータシフトによる性能劣化の検出
- Authors: Hao Guan, Li Zhou,
- Abstract要約: ビジョンランゲージモデルでは、医用画像解析や疾患診断に強い可能性を示している。
それらの性能は、開発中に観測されたデータから入力データ分布がシフトしたときに低下する可能性がある。
本研究では,最新の病理VLMにおけるデータシフトによる性能劣化検出について検討する。
- 参考スコア(独自算出の注目度): 3.7387218556204154
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-Language Models have demonstrated strong potential in medical image analysis and disease diagnosis. However, after deployment, their performance may deteriorate when the input data distribution shifts from that observed during development. Detecting such performance degradation is essential for clinical reliability, yet remains challenging for large pre-trained VLMs operating without labeled data. In this study, we investigate performance degradation detection under data shift in a state-of-the-art pathology VLM. We examine both input-level data shift and output-level prediction behavior to understand their respective roles in monitoring model reliability. To facilitate systematic analysis of input data shift, we develop DomainSAT, a lightweight toolbox with a graphical interface that integrates representative shift detection algorithms and enables intuitive exploration of data shift. Our analysis shows that while input data shift detection is effective at identifying distributional changes and providing early diagnostic signals, it does not always correspond to actual performance degradation. Motivated by this observation, we further study output-based monitoring and introduce a label-free, confidence-based degradation indicator that directly captures changes in model prediction confidence. We find that this indicator exhibits a close relationship with performance degradation and serves as an effective complement to input shift detection. Experiments on a large-scale pathology dataset for tumor classification demonstrate that combining input data shift detection and output confidence-based indicators enables more reliable detection and interpretation of performance degradation in VLMs under data shift. These findings provide a practical and complementary framework for monitoring the reliability of foundation models in digital pathology.
- Abstract(参考訳): ビジョンランゲージモデルでは、医用画像解析や疾患診断に強い可能性を示している。
しかし、展開後、入力データ分布が開発中に観測されたものからシフトすると、その性能が低下する可能性がある。
このような性能劣化の検出は臨床的信頼性に欠かせないが,ラベル付きデータを用いない大規模トレーニングVLMでは依然として困難である。
本研究では,最新の病理VLMにおけるデータシフトによる性能劣化検出について検討する。
本稿では,入力レベルのデータシフトと出力レベルの予測動作の双方について検討し,モデル信頼性のモニタリングにおけるそれぞれの役割について考察する。
入力データシフトの体系的解析を容易にするために,代表的なシフト検出アルゴリズムを統合し,データシフトの直感的な探索を可能にするグラフィカルインタフェースを備えた軽量ツールボックスであるDomainSATを開発した。
解析の結果,入力データシフト検出は分布変化の同定と早期診断信号の提供に有効であるが,必ずしも実際の性能劣化に対応するものではないことがわかった。
この観測により,出力に基づくモニタリングをさらに研究し,モデル予測信頼度の変化を直接キャプチャするラベルのない信頼性に基づく劣化指標を導入する。
この指標は性能劣化と密接な関係を示し,入力シフト検出の有効な補完となる。
腫瘍分類のための大規模病理データセットの実験により、入力データシフト検出と出力信頼度に基づくインジケータを組み合わせることで、データシフト下でのVLMの性能劣化のより信頼性の高い検出と解釈が可能になることが示された。
これらの知見は,デジタル病理学における基礎モデルの信頼性を監視するための,実用的で補完的な枠組みを提供する。
関連論文リスト
- Correcting False Alarms from Unseen: Adapting Graph Anomaly Detectors at Test Time [60.341117019125214]
グラフ異常検出(GAD)における未確認正規pattErnsの修正のための,軽量かつプラグアンドプレイなテスト時間適応フレームワークを提案する。
意味的混乱に対処するために、シフトしたデータと元のデータとをグラフ属性レベルで整合させるグラフ整合器を用いる。
10個の実世界のデータセットに対する大規模な実験により、TUNEは事前学習されたGADモデルの合成パターンと実際の見えない正常パターンの両方への一般化性を著しく向上することが示された。
論文 参考訳(メタデータ) (2025-11-10T12:10:05Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Representation Learning for Wearable-Based Applications in the Case of
Missing Data [20.37256375888501]
実環境におけるマルチモーダルセンサデータは、データ品質が低く、データアノテーションが限られているため、依然として困難である。
本稿では,不足するウェアラブルデータに対する表現学習について検討し,最新統計手法と比較する。
本研究は,マスキングに基づく自己指導型学習タスクの設計と開発に関する知見を提供する。
論文 参考訳(メタデータ) (2024-01-08T08:21:37Z) - Causal Disentanglement Hidden Markov Model for Fault Diagnosis [55.90917958154425]
本研究では, 軸受破壊機構の因果性を学ぶために, 因果解離隠れマルコフモデル (CDHM) を提案する。
具体的には、時系列データをフル活用し、振動信号を断層関連要因と断層関連要因に段階的に分解する。
アプリケーションの範囲を広げるために、学習された非絡み合った表現を他の作業環境に転送するために、教師なしのドメイン適応を採用する。
論文 参考訳(メタデータ) (2023-08-06T05:58:45Z) - Self-Supervised Graph Transformer for Deepfake Detection [1.8133635752982105]
ディープフェイク検出手法は、与えられたデータセット内の偽造を認識できる有望な結果を示している。
ディープフェイク検出システムは、一般的な検出性能を保証するために、偽造タイプ、外観、品質に欠かせないままでいなければならない。
本研究では、自己教師付き事前学習モデルを利用して、例外的な一般化能力を実現するディープフェイク検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-27T17:22:41Z) - Personalized Anomaly Detection in PPG Data using Representation Learning
and Biometric Identification [3.8036939971290007]
光胸腺造影信号は、継続的なフィットネス・ヘルスモニタリングに有意な可能性を秘めている。
Photoplethysmography信号は、一般的にウェアラブルデバイスから取得され、継続的なフィットネスと健康のモニタリングに重要な可能性を秘めている。
本稿では、表現学習とパーソナライズを利用した2段階のフレームワークを導入し、PSGデータの異常検出性能を改善する。
論文 参考訳(メタデータ) (2023-07-12T18:05:05Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Learning Informative Health Indicators Through Unsupervised Contrastive Learning [5.193936395510582]
本研究は、健康指標を学習するための、新規で汎用的で教師なしのアプローチを提案する。
アプローチは2つのタスクと異なる特性を持つケーススタディに基づいて評価される。
提案手法は, 製粉機械の摩耗に追従した健康指標を効果的に学習することを示す。
論文 参考訳(メタデータ) (2022-08-28T21:04:42Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。