論文の概要: Disentangling representations of retinal images with generative models
- arxiv url: http://arxiv.org/abs/2402.19186v3
- Date: Mon, 23 Jun 2025 10:48:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.147724
- Title: Disentangling representations of retinal images with generative models
- Title(参考訳): 生成モデルを用いた網膜像の遠心性表現
- Authors: Sarah Müller, Lisa M. Koch, Hendrik P. A. Lensch, Philipp Berens,
- Abstract要約: 患者属性をカメラ効果から効果的に切り離す網膜基底画像の集団モデルを提案する。
提案するモデルは,不整合部分空間において所望の情報を符号化し,学習した部分空間に基づいて制御可能な画像生成を可能にする。
- 参考スコア(独自算出の注目度): 12.235975451036047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retinal fundus images play a crucial role in the early detection of eye diseases. However, the impact of technical factors on these images can pose challenges for reliable AI applications in ophthalmology. For example, large fundus cohorts are often confounded by factors like camera type, bearing the risk of learning shortcuts rather than the causal relationships behind the image generation process. Here, we introduce a population model for retinal fundus images that effectively disentangles patient attributes from camera effects, enabling controllable and highly realistic image generation. To achieve this, we propose a disentanglement loss based on distance correlation. Through qualitative and quantitative analyses, we show that our models encode desired information in disentangled subspaces and enable controllable image generation based on the learned subspaces, demonstrating the effectiveness of our disentanglement loss. The project's code is publicly available: https://github.com/berenslab/disentangling-retinal-images.
- Abstract(参考訳): 網膜基底像は眼疾患の早期発見において重要な役割を担っている。
しかし、これらの画像に対する技術的要因の影響は、眼科における信頼性の高いAI応用に課題をもたらす可能性がある。
例えば、大きなファンドスコホートは、画像生成プロセスの背後にある因果関係ではなく、ショートカットを学習するリスクを負って、カメラタイプのような要因によって構築されることが多い。
本稿では,患者属性をカメラ効果から効果的に切り離し,制御可能でリアルな画像生成を可能にする網膜基底画像の集団モデルを提案する。
これを実現するために,距離相関に基づく不整合損失を提案する。
定性的かつ定量的な分析により,我々のモデルは,不整合部分空間において所望の情報を符号化し,学習した部分空間に基づいて制御可能な画像生成を可能にし,不整合損失の有効性を示す。
プロジェクトのコードは、https://github.com/berenslab/disentangling-retinal-images.comで公開されている。
関連論文リスト
- Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。
本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文 参考訳(メタデータ) (2025-04-20T01:54:18Z) - Enhancing Retinal Disease Classification from OCTA Images via Active Learning Techniques [0.8035416719640156]
高齢のアメリカ人では眼疾患が一般的であり、視力や視力の低下につながることがある。
光コヒーレンス・トモグラフィ・アンギオグラフィー(OCTA)により、臨床医が網膜血管の高品質な画像を取得することができる画像技術の最近の進歩
OCTAは、一般的なOCT画像から得られる構造情報と比較して、詳細な血管画像を提供する。
論文 参考訳(メタデータ) (2024-07-21T23:24:49Z) - Enhance Eye Disease Detection using Learnable Probabilistic Discrete Latents in Machine Learning Architectures [1.6000489723889526]
糖尿病網膜症や緑内障などの眼疾患は、公衆衛生上の重大な課題となる。
深層学習モデルは、網膜イメージングのような医療画像を分析する強力なツールとして登場した。
課題は、モデル適合性と不確実性の推定であり、これは臨床的な意思決定に不可欠である。
論文 参考訳(メタデータ) (2024-01-21T04:14:54Z) - Gravity Network for end-to-end small lesion detection [50.38534263407915]
本稿では,医療画像の小さな病変を特異的に検出するワンステージエンド・ツー・エンド検出器を提案する。
小さな病変の正確な局在化は、その外観と、それらが見つかる様々な背景によって困難を呈する。
この新たなアーキテクチャをGravityNetと呼び、新しいアンカーを重力点と呼ぶ。
論文 参考訳(メタデータ) (2023-09-22T14:02:22Z) - ROCT-Net: A new ensemble deep convolutional model with improved spatial
resolution learning for detecting common diseases from retinal OCT images [0.0]
本稿では,OCT画像から網膜疾患を検出するために,新たな深層アンサンブル畳み込みニューラルネットワークを提案する。
本モデルは,2つの頑健な畳み込みモデルの学習アーキテクチャを用いて,リッチかつマルチレゾリューションな特徴を生成する。
2つのデータセットに関する実験と、他のよく知られた深層畳み込みニューラルネットワークとの比較により、アーキテクチャが分類精度を最大5%向上できることが証明された。
論文 参考訳(メタデータ) (2022-03-03T17:51:01Z) - Data-driven generation of plausible tissue geometries for realistic
photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。
我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。
我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文 参考訳(メタデータ) (2021-03-29T11:30:18Z) - Multi-Disease Detection in Retinal Imaging based on Ensembling
Heterogeneous Deep Learning Models [0.0]
網膜イメージングのための革新的なマルチディセーゼ検出パイプラインを提案する。
当社のパイプラインには、転送学習、クラス重み付け、リアルタイム画像増強、焦点損失利用などの最先端の戦略が含まれます。
論文 参考訳(メタデータ) (2021-03-26T18:02:17Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Modeling and Enhancing Low-quality Retinal Fundus Images [167.02325845822276]
低画質の眼底画像は臨床観察における不確実性を高め、誤診のリスクを引き起こす。
本稿では,グローバルな劣化要因を抑えるために,臨床指向の基盤拡張ネットワーク(cofe-Net)を提案する。
合成画像と実画像の両方の実験により、我々のアルゴリズムは網膜の細部を失うことなく、低品質の眼底画像を効果的に補正することを示した。
論文 参考訳(メタデータ) (2020-05-12T08:01:16Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。