論文の概要: OFF-CLIP: Improving Normal Detection Confidence in Radiology CLIP with Simple Off-Diagonal Term Auto-Adjustment
- arxiv url: http://arxiv.org/abs/2503.01794v1
- Date: Mon, 03 Mar 2025 18:24:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:18:10.329425
- Title: OFF-CLIP: Improving Normal Detection Confidence in Radiology CLIP with Simple Off-Diagonal Term Auto-Adjustment
- Title(参考訳): OFF-CLIP:単純な対角端自動調整による放射線診断CLIPの正常検出信頼度の改善
- Authors: Junhyun Park, Chanyu Moon, Donghwan Lee, Kyungsu Kim, Minho Hwang,
- Abstract要約: 正規検出を改良する対照的な学習改善であるOF-CLIPを提案する。
OFF-CLIPは、アーキテクチャの変更を必要とせずに、放射線学のCLIPモデルに適用することができる。
- 参考スコア(独自算出の注目度): 6.085134938844728
- License:
- Abstract: Contrastive Language-Image Pre-Training (CLIP) has enabled zero-shot classification in radiology, reducing reliance on manual annotations. However, conventional contrastive learning struggles with normal case detection due to its strict intra-sample alignment, which disrupts normal sample clustering and leads to high false positives (FPs) and false negatives (FNs). To address these issues, we propose OFF-CLIP, a contrastive learning refinement that improves normal detection by introducing an off-diagonal term loss to enhance normal sample clustering and applying sentence-level text filtering to mitigate FNs by removing misaligned normal statements from abnormal reports. OFF-CLIP can be applied to radiology CLIP models without requiring any architectural modifications. Experimental results show that OFF-CLIP significantly improves normal classification, achieving a 0.61 Area under the curve (AUC) increase on VinDr-CXR over CARZero, the state-of-the-art zero-shot classification baseline, while maintaining or improving abnormal classification performance. Additionally, OFF-CLIP enhances zero-shot grounding by improving pointing game accuracy, confirming better anomaly localization. These results demonstrate OFF-CLIP's effectiveness as a robust and efficient enhancement for medical vision-language models.
- Abstract(参考訳): 対照的に、CLIP(Contrastive Language- Image Pre-Training)は、放射線学におけるゼロショット分類を可能にし、手動アノテーションへの依存を減らす。
しかし、従来のコントラスト学習は、サンプル内の厳密なアライメントが正常なサンプルクラスタリングを妨害し、偽陽性(FPs)と偽陰性(FNs)を引き起こすため、通常のケース検出に苦慮している。
これらの問題に対処するため,通常のサンプルクラスタリングを強化し,不整合な正規文を異常報告から除去してFNを緩和するために文レベルのテキストフィルタリングを適用して,対角外項損失を導入して正規検出を改善することによる,対照的な学習改善であるOF-CLIPを提案する。
OFF-CLIPは、アーキテクチャの変更を必要とせずに、放射線学のCLIPモデルに適用することができる。
実験の結果,OF-CLIPは正常分類を著しく改善し,VinDr-CXR曲線(AUC)の0.61領域をCARZero上で達成し,異常分類性能の維持・改善を図った。
さらに、OF-CLIPはポインティングゲーム精度を改善してゼロショットグラウンド化を強化し、異常なローカライゼーションを改善する。
これらの結果から,医用視覚言語モデルの堅牢かつ効率的な拡張としてのOF-CLIPの有効性が示された。
関連論文リスト
- Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Robust Calibration of Large Vision-Language Adapters [17.583536041845402]
本稿では,CLIPに基づくモデル適応における誤校正の重大な問題に対処する。
実験により,0ショットベースラインのキャリブレーション能力を大幅に低下させる,Adapters,Prompt Learning,Test-Time Adaptationなどの一般的なCLIP適応アプローチを実証した。
これらの観測により、各試料の対数範囲をゼロショット予測ロジットに拡大することにより、誤校正を緩和するための単純でモデルに依存しない解が提示される。
論文 参考訳(メタデータ) (2024-07-18T15:27:56Z) - On Temperature Scaling and Conformal Prediction of Deep Classifiers [9.975341265604577]
コンフォーマル予測(CP)は、ユーザが特定した確率で真のラベルを含む候補ラベルの予測セットを生成する。
実際には、どちらの種類の表示も望ましいが、今のところ両者の相互作用は研究されていない。
温度スケーリング(TS)キャリブレーションは適応CP法のクラス条件カバレッジを改善するが、驚くべきことに予測セットサイズに悪影響を及ぼす。
論文 参考訳(メタデータ) (2024-02-08T16:45:12Z) - Bootstrap Fine-Grained Vision-Language Alignment for Unified Zero-Shot
Anomaly Localization [63.61093388441298]
対照的な言語-画像事前学習モデルは、ゼロショット視覚認識タスクで有望なパフォーマンスを示した。
本研究では,ゼロショット異常局所化のためのAnoCLIPを提案する。
論文 参考訳(メタデータ) (2023-08-30T10:35:36Z) - Enabling Calibration In The Zero-Shot Inference of Large Vision-Language
Models [58.720142291102135]
プロンプト、データセット、アーキテクチャといった関連する変数のキャリブレーションを測定し、CLIPによるゼロショット推論が誤校正されていることを見つけます。
学習した1つの温度は、推論データセットにまたがって特定のCLIPモデルごとに一般化され、選択が促される。
論文 参考訳(メタデータ) (2023-03-11T17:14:04Z) - A Benchmark for Weakly Semi-Supervised Abnormality Localization in Chest
X-Rays [42.1336336144291]
本稿では,弱い半教師付き戦略であるPoint Beyond Classを用いて,CXR異常局所化フレームワークを訓練することを提案する。
PBCの背後にある中核的な考え方は、ポイントアノテーションからバウンディングボックスへの堅牢で正確なマッピングを学ぶことです。
RSNAとVinDr-CXRデータセットの実験結果は,提案手法の有効性を正当化するものである。
論文 参考訳(メタデータ) (2022-09-05T14:36:07Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Simple Adaptive Projection with Pretrained Features for Anomaly
Detection [0.0]
本稿では,単純な線形変換と自己注意を含む新しい適応フレームワークを提案する。
事前訓練した特徴を持つ簡易適応投影法(SAP2)により,新しい異常検出基準が得られた。
論文 参考訳(メタデータ) (2021-12-05T15:29:59Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - CASTLE: Regularization via Auxiliary Causal Graph Discovery [89.74800176981842]
因果構造学習(CASTLE)の正規化を導入し,変数間の因果関係を共同学習することでニューラルネットワークの正規化を提案する。
CASTLEは因果的隣り合いを持つ因果的DAGの特徴のみを効率的に再構成する一方、再構成ベース正規化器は全ての入力特徴を過度に再構成する。
論文 参考訳(メタデータ) (2020-09-28T09:49:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。