論文の概要: Generalizing to Unseen Domains in Diabetic Retinopathy with Disentangled Representations
- arxiv url: http://arxiv.org/abs/2406.06384v1
- Date: Mon, 10 Jun 2024 15:43:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 13:18:57.735917
- Title: Generalizing to Unseen Domains in Diabetic Retinopathy with Disentangled Representations
- Title(参考訳): 解離性表現を伴う糖尿病網膜症における未確認領域への一般化
- Authors: Peng Xia, Ming Hu, Feilong Tang, Wenxue Li, Wenhao Zheng, Lie Ju, Peibo Duan, Huaxiu Yao, Zongyuan Ge,
- Abstract要約: 既存のモデルは、ドメインシフトのため、目に見えないドメインで顕著なパフォーマンス劣化を経験します。
本稿では,異なるドメインのペアデータの表現をセマンティックな特徴とドメインノイズに分離する新しいフレームワークを提案する。
結果として得られる拡張表現は、他のドメインからの独自の網膜意味論とドメインノイズを含み、実際の臨床ニーズに合わせて拡張表現を生成することを目的としている。
- 参考スコア(独自算出の注目度): 32.7667209371645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diabetic Retinopathy (DR), induced by diabetes, poses a significant risk of visual impairment. Accurate and effective grading of DR aids in the treatment of this condition. Yet existing models experience notable performance degradation on unseen domains due to domain shifts. Previous methods address this issue by simulating domain style through simple visual transformation and mitigating domain noise via learning robust representations. However, domain shifts encompass more than image styles. They overlook biases caused by implicit factors such as ethnicity, age, and diagnostic criteria. In our work, we propose a novel framework where representations of paired data from different domains are decoupled into semantic features and domain noise. The resulting augmented representation comprises original retinal semantics and domain noise from other domains, aiming to generate enhanced representations aligned with real-world clinical needs, incorporating rich information from diverse domains. Subsequently, to improve the robustness of the decoupled representations, class and domain prototypes are employed to interpolate the disentangled representations while data-aware weights are designed to focus on rare classes and domains. Finally, we devise a robust pixel-level semantic alignment loss to align retinal semantics decoupled from features, maintaining a balance between intra-class diversity and dense class features. Experimental results on multiple benchmarks demonstrate the effectiveness of our method on unseen domains. The code implementations are accessible on https://github.com/richard-peng-xia/DECO.
- Abstract(参考訳): 糖尿病により引き起こされる糖尿病網膜症(DR)は、視覚障害の重大なリスクを負う。
DR補薬の精密かつ効果的なグレーディングは、この状態の治療に有効である。
しかし、既存のモデルはドメインシフトのため、目に見えないドメインで顕著なパフォーマンス劣化を経験します。
従来の手法では、単純な視覚変換を通じてドメインスタイルをシミュレートし、堅牢な表現を学習することでドメインノイズを緩和することでこの問題に対処していた。
しかし、ドメインシフトはイメージスタイル以上のものを含んでいる。
彼らは民族、年齢、診断基準などの暗黙の要因によって引き起こされる偏見を見落としている。
本研究では,異なるドメイン間のペアデータの表現をセマンティックな特徴とドメインノイズに分離する新しいフレームワークを提案する。
結果として得られる拡張表現は、他のドメインからの独自の網膜意味論とドメインノイズを含み、多様なドメインからの豊富な情報を組み込んで、現実の臨床的ニーズに沿った拡張表現を生成することを目的としている。
その後、疎結合表現のロバスト性を改善するために、クラスとドメインのプロトタイプは、非絡み合った表現を補間するために使用され、データ認識重みは、稀なクラスやドメインに焦点を当てるように設計されている。
最後に,特徴から分離された網膜意味論を整合させるために,高解像度の画素レベルのセマンティックアライメント損失を考案し,クラス内多様性と高密度なクラス特徴とのバランスを維持する。
複数のベンチマークによる実験結果から,本手法が未確認領域における有効性を示した。
コードの実装はhttps://github.com/richard-peng-xia/DECOでアクセスできる。
関連論文リスト
- Cross-Domain Policy Adaptation by Capturing Representation Mismatch [53.087413751430255]
強化学習(RL)において、動的に異なる領域に移行できる効果的な政策を学ぶことが不可欠である。
本稿では、ソースドメインとターゲットドメインとの間に動的ミスマッチが存在する場合の動的適応設定について考察する。
対象領域でのみ表現学習を行い、ソース領域からの遷移における表現偏差を測定する。
論文 参考訳(メタデータ) (2024-05-24T09:06:12Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Cyclically Disentangled Feature Translation for Face Anti-spoofing [61.70377630461084]
循環不整合特徴変換ネットワーク(CDFTN)と呼ばれる新しい領域適応手法を提案する。
CDFTNは、(1)ソースドメイン不変の生長特徴と2)ドメイン固有のコンテンツ特徴とを持つ擬似ラベル付きサンプルを生成する。
ソースドメインラベルの監督の下で、合成擬似ラベル付き画像に基づいてロバスト分類器を訓練する。
論文 参考訳(メタデータ) (2022-12-07T14:12:34Z) - Contrastive Domain Disentanglement for Generalizable Medical Image
Segmentation [12.863227646939563]
本稿では,一般的な医用画像分割のためのコントラストディスタングル・ドメイン(CDD)ネットワークを提案する。
まず、医用画像を解剖学的表現因子とモダリティ表現因子に分解する不整合ネットワークを導入する。
次に、モデル一般化学習のための新しい領域をランダムに生成できる領域拡張戦略を提案する。
論文 参考訳(メタデータ) (2022-05-13T10:32:41Z) - Unsupervised Domain Adaptation with Semantic Consistency across
Heterogeneous Modalities for MRI Prostate Lesion Segmentation [19.126306953075275]
セマンティック一貫性を促進する2つの新しい損失関数を導入する。
特に,高度な拡散強調画像技術であるVERDICT-MRIの性能向上の課題に対処する。
論文 参考訳(メタデータ) (2021-09-19T17:33:26Z) - Self-Supervised Domain Adaptation for Diabetic Retinopathy Grading using
Vessel Image Reconstruction [61.58601145792065]
我々は網膜血管画像再構成に基づく新しい自己教師型タスクを定義することで、不変なターゲットドメインの特徴を学習する。
私たちのアプローチは既存のドメイン戦略よりも優れています。
論文 参考訳(メタデータ) (2021-07-20T09:44:07Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Consistent Posterior Distributions under Vessel-Mixing: A Regularization
for Cross-Domain Retinal Artery/Vein Classification [30.30848090813239]
網膜A/V分類におけるクロスドメイン学習のための船舶混合型整合性正規化フレームワークを提案する。
提案手法は,対象ドメインに対する教師付き学習によって得られる上界に近い,最先端のクロスドメイン性能を実現する。
論文 参考訳(メタデータ) (2021-03-16T14:18:35Z) - Unsupervised Domain Adaptation Network with Category-Centric Prototype
Aligner for Biomedical Image Segmentation [1.1799563040751586]
本稿では,ラベル付きソースドメインから非ラベル付きターゲットドメインへ学習したモデルを一般化するための新しい非監視ドメイン適応ネットワークを提案する。
具体的には,条件付きドメイン判別器(cdd)とカテゴリ中心プロトタイプライナー(ccpa)という2つのキーモジュールからなる。
論文 参考訳(メタデータ) (2021-03-03T07:07:38Z) - CrDoCo: Pixel-level Domain Transfer with Cross-Domain Consistency [119.45667331836583]
教師なしのドメイン適応アルゴリズムは、あるドメインから学んだ知識を別のドメインに転送することを目的としている。
本稿では,新しい画素単位の対向領域適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-09T19:00:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。