論文の概要: EPVT: Environment-aware Prompt Vision Transformer for Domain
Generalization in Skin Lesion Recognition
- arxiv url: http://arxiv.org/abs/2304.01508v1
- Date: Tue, 4 Apr 2023 03:36:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 15:23:45.319458
- Title: EPVT: Environment-aware Prompt Vision Transformer for Domain
Generalization in Skin Lesion Recognition
- Title(参考訳): EPVT:皮膚病変認識における領域一般化のための環境対応プロンプトビジョントランス
- Authors: Siyuan Yan, Chi Liu, Zhen Yu, Lie Ju, Dwarikanath Mahapatrainst,
Victoria Mar, Monika Janda, Peter Soyer, Zongyuan Ge
- Abstract要約: 深層学習を用いた皮膚病変認識は目覚ましい進歩を遂げており、現実のシナリオにこれらのシステムをデプロイする必要性が高まっている。
近年の研究では、皮膚病変認識のためのディープニューラルネットワークが、疾患に関連のない画像アーティファクトに過度に依存する可能性があることが判明している。
本研究では、視覚変換器にプロンプトを埋め込んで様々な領域から知識を協調的に学習するEPVTと呼ばれる新しい領域一般化手法を提案する。
- 参考スコア(独自算出の注目度): 12.91556412209546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Skin lesion recognition using deep learning has made remarkable progress, and
there is an increasing need for deploying these systems in real-world
scenarios. However, recent research has revealed that deep neural networks for
skin lesion recognition may overly depend on disease-irrelevant image artifacts
(i.e. dark corners, dense hairs), leading to poor generalization in unseen
environments. To address this issue, we propose a novel domain generalization
method called EPVT, which involves embedding prompts into the vision
transformer to collaboratively learn knowledge from diverse domains.
Concretely, EPVT leverages a set of domain prompts, each of which plays as a
domain expert, to capture domain-specific knowledge; and a shared prompt for
general knowledge over the entire dataset. To facilitate knowledge sharing and
the interaction of different prompts, we introduce a domain prompt generator
that enables low-rank multiplicative updates between domain prompts and the
shared prompt. A domain mixup strategy is additionally devised to reduce the
co-occurring artifacts in each domain, which allows for more flexible decision
margins and mitigates the issue of incorrectly assigned domain labels.
Experiments on four out-of-distribution datasets and six different biased ISIC
datasets demonstrate the superior generalization ability of EPVT in skin lesion
recognition across various environments. Our code and dataset will be released
at https://github.com/SiyuanYan1/EPVT.
- Abstract(参考訳): 深層学習を用いた皮膚病変認識は目覚ましい進歩を遂げており、現実のシナリオにこれらのシステムをデプロイする必要性が高まっている。
しかし、近年の研究では、皮膚病変認識のための深層ニューラルネットワークが、疾患に関係のない画像アーティファクト(ダークコーナー、濃密な毛髪など)に過度に依存し、目に見えない環境での一般化を損なう可能性があることが判明している。
この問題に対処するために,視覚変換器にプロンプトを埋め込み,多様な領域から知識を協調的に学習するEPVTと呼ばれる新しい領域一般化手法を提案する。
具体的には、EPVTはドメインの専門家として機能する一連のドメインプロンプトを活用して、ドメイン固有の知識をキャプチャします。
知識共有と異なるプロンプトの相互作用を容易にするため,ドメインプロンプトと共有プロンプト間の低ランク乗算更新を可能にするドメインプロンプト生成手法を提案する。
ドメインのミックスアップ戦略は、各ドメインの共起アーティファクトを減らすためにさらに考案され、より柔軟な決定マージンを可能にし、誤って割り当てられたドメインラベルの問題を軽減する。
4つの分布外データセットと6つのバイアス付きISICデータセットの実験は、様々な環境における皮膚病変認識におけるEVVTのより優れた一般化能力を示す。
コードとデータセットはhttps://github.com/SiyuanYan1/EPVT.comで公開されます。
関連論文リスト
- Beyond Finite Data: Towards Data-free Out-of-distribution Generalization
via Extrapolation [19.944946262284123]
ニューラルネットワークが人間のように外挿し、OODの一般化を実現するにはどうすればよいのか?
本稿では,大言語モデル(LLM)にカプセル化されている推論能力と広範な知識を活用して,完全に新しいドメインを合成する領域外挿手法を提案する。
提案手法は, VLCSなどのデータセットにおいて, 教師付き設定を約1~2%超え, 評価可能な性能を示す。
論文 参考訳(メタデータ) (2024-03-08T18:44:23Z) - Prompt-driven Latent Domain Generalization for Medical Image
Classification [23.914889221925552]
ドメインラベルに依存しない医用画像分類のための新しい枠組みを提案する。
PLDGは教師なしのドメイン発見と迅速な学習で構成されている。
提案手法は従来のDGアルゴリズムと同等あるいはそれ以上の性能を達成できる。
論文 参考訳(メタデータ) (2024-01-05T05:24:07Z) - Single Domain Dynamic Generalization for Iris Presentation Attack
Detection [41.126916126040655]
アイリスプレゼンテーションの一般化はドメイン内の設定では大きな成功を収めたが、目に見えないドメインでは容易に分解できる。
本稿では,ドメイン不変性とドメイン固有性を利用した単一ドメイン動的一般化(SDDG)フレームワークを提案する。
提案手法は有効であり,LivDet-Iris 2017データセットの最先端性を上回っている。
論文 参考訳(メタデータ) (2023-05-22T07:54:13Z) - Context-aware Domain Adaptation for Time Series Anomaly Detection [69.3488037353497]
時系列異常検出は、幅広い現実世界の応用において難しい課題である。
近年,類似分野の知識を活用するため,時系列領域適応への取り組みが進められている。
本研究では,コンテキストサンプリングと異常検出を併用した共同学習手法を提案する。
論文 参考訳(メタデータ) (2023-04-15T02:28:58Z) - Towards Generalization on Real Domain for Single Image Dehazing via
Meta-Learning [41.99615673136883]
合成画像から得られた内部情報は、通常、実際の領域では準最適である。
本稿では,メタラーニングに基づくドメイン一般化フレームワークを提案する。
提案手法は,最先端の競争相手よりも優れた一般化能力を有する。
論文 参考訳(メタデータ) (2022-11-14T07:04:00Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Variational Attention: Propagating Domain-Specific Knowledge for
Multi-Domain Learning in Crowd Counting [75.80116276369694]
群集カウントでは, 激しいラベル付けの問題により, 新しい大規模データセットを収集する難易度が知覚される。
マルチドメイン共同学習を活用し,DKPNet(Domain-specific Knowledge Propagating Network)を提案する。
主に、異なるドメインに対する注意分布を明示的にモデル化する、新しい変動注意法(VA)技術を提案する。
論文 参考訳(メタデータ) (2021-08-18T08:06:37Z) - Open Domain Generalization with Domain-Augmented Meta-Learning [83.59952915761141]
オープンドメイン一般化(OpenDG)の新しい実践的問題について研究する。
本稿では,オープンドメイン一般化表現を学ぶためのメタ学習フレームワークを提案する。
種々のマルチドメインデータセットの実験結果から、提案したドメイン拡張メタラーニング(DAML)が、未確認ドメイン認識の先行手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-08T09:12:24Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - Cross-domain Face Presentation Attack Detection via Multi-domain
Disentangled Representation Learning [109.42987031347582]
顔提示攻撃検出(PAD)は,顔認識システムにおいて緊急に解決すべき課題である。
クロスドメイン顔PADのための効率的な非交叉表現学習を提案する。
我々のアプローチは、不整合表現学習(DR-Net)とマルチドメイン学習(MD-Net)からなる。
論文 参考訳(メタデータ) (2020-04-04T15:45:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。