論文の概要: Domain Adaptive Skin Lesion Classification via Conformal Ensemble of Vision Transformers
- arxiv url: http://arxiv.org/abs/2505.15997v1
- Date: Wed, 21 May 2025 20:28:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:47.896031
- Title: Domain Adaptive Skin Lesion Classification via Conformal Ensemble of Vision Transformers
- Title(参考訳): 視覚変換器のコンフォーマルアンサンブルによる領域適応型皮膚病変分類
- Authors: Mehran Zoravar, Shadi Alijani, Homayoun Najjaran,
- Abstract要約: 本稿では,コンフォーマル・アンサンブル・オブ・ビジョン・トランスフォーマー(CE-ViT)と呼ばれる新しいフレームワークを提案する。
領域適応とモデルロバスト性を優先し,不確実性を考慮し,画像分類性能の向上を図る。
このフレームワークは、HAM10000モデルと比較して9.95%の改善を示す90.38%という高いカバレッジ率を達成する。
- 参考スコア(独自算出の注目度): 3.7305040207339286
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Exploring the trustworthiness of deep learning models is crucial, especially in critical domains such as medical imaging decision support systems. Conformal prediction has emerged as a rigorous means of providing deep learning models with reliable uncertainty estimates and safety guarantees. However, conformal prediction results face challenges due to the backbone model's struggles in domain-shifted scenarios, such as variations in different sources. To aim this challenge, this paper proposes a novel framework termed Conformal Ensemble of Vision Transformers (CE-ViTs) designed to enhance image classification performance by prioritizing domain adaptation and model robustness, while accounting for uncertainty. The proposed method leverages an ensemble of vision transformer models in the backbone, trained on diverse datasets including HAM10000, Dermofit, and Skin Cancer ISIC datasets. This ensemble learning approach, calibrated through the combined mentioned datasets, aims to enhance domain adaptation through conformal learning. Experimental results underscore that the framework achieves a high coverage rate of 90.38\%, representing an improvement of 9.95\% compared to the HAM10000 model. This indicates a strong likelihood that the prediction set includes the true label compared to singular models. Ensemble learning in CE-ViTs significantly improves conformal prediction performance, increasing the average prediction set size for challenging misclassified samples from 1.86 to 3.075.
- Abstract(参考訳): 深層学習モデルの信頼性を探求することは、特に医用画像決定支援システムのような重要な領域において重要である。
コンフォーマル予測は、確実な不確実性推定と安全性保証を備えたディープラーニングモデルを提供するための厳密な手段として登場した。
しかし、コンフォーマルな予測結果は、異なるソースのバリエーションのようなドメインシフトシナリオにおけるバックボーンモデルの苦労によって、課題に直面している。
そこで本研究では,領域適応とモデルロバスト性を優先し,不確実性を考慮した画像分類性能の向上を目的とした,コンフォーマル・アンサンブル・オブ・ビジョン・トランスフォーマー(CE-ViT)と呼ばれる新しいフレームワークを提案する。
提案手法は、HAM10000、Dermofit、皮膚がんISICデータセットなどの多様なデータセットに基づいてトレーニングされた、背骨内の視覚トランスフォーマーモデルのアンサンブルを利用する。
このアンサンブル学習アプローチは、前述のデータセットを組み合わせて校正され、共形学習によるドメイン適応を強化することを目的としている。
実験の結果、このフレームワークはHAM10000モデルと比較して90.38\%高いカバレッジ率を示し、9.95\%の改善を示している。
これは、予測集合が特異モデルと比較して真のラベルを含むという強い可能性を示している。
CE-ViTにおけるアンサンブル学習は、コンフォメーション予測性能を著しく向上させ、未分類標本を1.86から3.075に分類する際の平均予測セットサイズを増大させる。
関連論文リスト
- Adaptive Prompt Tuning: Vision Guided Prompt Tuning with Cross-Attention for Fine-Grained Few-Shot Learning [5.242869847419834]
コンピュータビジョンにおける微妙な分類は、限られたデータで微妙な分類を区別する必要があるため、大きな課題となる。
本稿では,適応的なプロンプトチューニングにより,コントラスト言語画像事前学習モデルを強化する手法を提案する。
論文 参考訳(メタデータ) (2024-12-19T08:51:01Z) - Are foundation models for computer vision good conformal predictors? [17.53651859360999]
コンフォーマル予測(CP)に基づく視覚・視覚言語基礎モデルの振る舞いについて検討する。
この結果から, 基礎モデルはコンフォーマライズ手順, 特にビジョントランスフォーマーの統合に適していることが判明した。
また、下流タスクへのビジョン・ランゲージ・モデル(VLM)の少数ショット適応が、ゼロショット予測と比較してコンフォメーションスコアを高めていることを示す。
論文 参考訳(メタデータ) (2024-12-08T22:05:38Z) - Generalized Face Forgery Detection via Adaptive Learning for Pre-trained Vision Transformer [54.32283739486781]
適応学習パラダイムの下で,textbfForgery-aware textbfAdaptive textbfVision textbfTransformer(FA-ViT)を提案する。
FA-ViTは、クロスデータセット評価において、Celeb-DFおよびDFDCデータセット上で93.83%と78.32%のAUCスコアを達成する。
論文 参考訳(メタデータ) (2023-09-20T06:51:11Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Towards Better Certified Segmentation via Diffusion Models [62.21617614504225]
セグメンテーションモデルは敵の摂動に弱いため、医療や自動運転といった重要な意思決定システムでの使用を妨げます。
近年,理論的保証を得るためにガウス雑音を入力に加えることにより,セグメント化予測のランダム化が提案されている。
本稿では,ランダムな平滑化と拡散モデルを組み合わせたセグメンテーション予測の問題に対処する。
論文 参考訳(メタデータ) (2023-06-16T16:30:39Z) - Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic
Image Classification [61.656149405657246]
ドメイン適応は、十分なラベルデータを取得することが困難な画像分類タスクに有効である。
本稿では,3つのドメイン適応手法を拡張することで,アンサンブル学習を積み重ねるための新しい手法SELDAを提案する。
Age-Related Eye Disease Study (AREDS)ベンチマーク眼科データセットを用いた実験結果から,提案モデルの有効性が示された。
論文 参考訳(メタデータ) (2022-09-27T14:19:00Z) - Transformer Uncertainty Estimation with Hierarchical Stochastic
Attention [8.95459272947319]
本稿では,変圧器に不確実性推定機能を持たせるための新しい手法を提案する。
これは、価値と学習可能なセントロイドのセットに付随する階層的な自己注意を学ぶことで達成される。
我々は、ドメイン内(ID)とドメイン外(OOD)の両方のデータセットを用いて、2つのテキスト分類タスクでモデルを実証的に評価する。
論文 参考訳(メタデータ) (2021-12-27T16:43:31Z) - A Variational Bayesian Approach to Learning Latent Variables for
Acoustic Knowledge Transfer [55.20627066525205]
本稿では,ディープニューラルネットワーク(DNN)モデルにおける潜伏変数の分布を学習するための変分ベイズ(VB)アプローチを提案する。
我々の提案するVBアプローチは,ターゲットデバイスにおいて良好な改善が得られ,しかも,13の最先端知識伝達アルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2021-10-16T15:54:01Z) - Closer Look at the Uncertainty Estimation in Semantic Segmentation under
Distributional Shift [2.05617385614792]
セマンティックセグメンテーションのタスクの不確かさをドメインシフトの異なるレベルで評価する。
単純な色変換は、既に強いベースラインを提供していることが示されている。
モデルのアンサンブルは、擬似ラベル生成を改善するために自己学習設定に利用された。
論文 参考訳(メタデータ) (2021-05-31T19:50:43Z) - From Sound Representation to Model Robustness [82.21746840893658]
本研究では, 環境音の標準的な表現(スペクトログラム)が, 被害者の残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
3つの環境音響データセットの様々な実験から、ResNet-18モデルは、他のディープラーニングアーキテクチャよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-27T17:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。