論文の概要: Disentangling representations of retinal images with generative models
- arxiv url: http://arxiv.org/abs/2402.19186v3
- Date: Mon, 23 Jun 2025 10:48:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.147724
- Title: Disentangling representations of retinal images with generative models
- Title(参考訳): 生成モデルを用いた網膜像の遠心性表現
- Authors: Sarah Müller, Lisa M. Koch, Hendrik P. A. Lensch, Philipp Berens,
- Abstract要約: 患者属性をカメラ効果から効果的に切り離す網膜基底画像の集団モデルを提案する。
提案するモデルは,不整合部分空間において所望の情報を符号化し,学習した部分空間に基づいて制御可能な画像生成を可能にする。
- 参考スコア(独自算出の注目度): 12.235975451036047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retinal fundus images play a crucial role in the early detection of eye diseases. However, the impact of technical factors on these images can pose challenges for reliable AI applications in ophthalmology. For example, large fundus cohorts are often confounded by factors like camera type, bearing the risk of learning shortcuts rather than the causal relationships behind the image generation process. Here, we introduce a population model for retinal fundus images that effectively disentangles patient attributes from camera effects, enabling controllable and highly realistic image generation. To achieve this, we propose a disentanglement loss based on distance correlation. Through qualitative and quantitative analyses, we show that our models encode desired information in disentangled subspaces and enable controllable image generation based on the learned subspaces, demonstrating the effectiveness of our disentanglement loss. The project's code is publicly available: https://github.com/berenslab/disentangling-retinal-images.
- Abstract(参考訳): 網膜基底像は眼疾患の早期発見において重要な役割を担っている。
しかし、これらの画像に対する技術的要因の影響は、眼科における信頼性の高いAI応用に課題をもたらす可能性がある。
例えば、大きなファンドスコホートは、画像生成プロセスの背後にある因果関係ではなく、ショートカットを学習するリスクを負って、カメラタイプのような要因によって構築されることが多い。
本稿では,患者属性をカメラ効果から効果的に切り離し,制御可能でリアルな画像生成を可能にする網膜基底画像の集団モデルを提案する。
これを実現するために,距離相関に基づく不整合損失を提案する。
定性的かつ定量的な分析により,我々のモデルは,不整合部分空間において所望の情報を符号化し,学習した部分空間に基づいて制御可能な画像生成を可能にし,不整合損失の有効性を示す。
プロジェクトのコードは、https://github.com/berenslab/disentangling-retinal-images.comで公開されている。
関連論文リスト
- Exploring the Effectiveness of Deep Features from Domain-Specific Foundation Models in Retinal Image Synthesis [0.0]
医療画像におけるニューラルネットワークモデルの採用は、厳格なプライバシー規制、データ可用性の制限、高い取得コスト、人口統計バイアスによって制限されている。
本研究では,大規模なドメインデータ,カラー・ファンド・イメージングに基づいて訓練された大規模基盤モデルの深部活性化層に基づく距離ベース損失関数が,知覚的損失とエッジ検出に基づく損失関数よりも有利であるかどうかを実験的に検討した。
論文 参考訳(メタデータ) (2025-06-13T13:09:11Z) - PixCell: A generative foundation model for digital histopathology images [49.00921097924924]
PixCellは,病理組織学における最初の拡散ベース生成基盤モデルである。
われわれはPanCan-30MでPixCellをトレーニングした。
論文 参考訳(メタデータ) (2025-06-05T15:14:32Z) - Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。
本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文 参考訳(メタデータ) (2025-04-20T01:54:18Z) - Enhancing Retinal Disease Classification from OCTA Images via Active Learning Techniques [0.8035416719640156]
高齢のアメリカ人では眼疾患が一般的であり、視力や視力の低下につながることがある。
光コヒーレンス・トモグラフィ・アンギオグラフィー(OCTA)により、臨床医が網膜血管の高品質な画像を取得することができる画像技術の最近の進歩
OCTAは、一般的なOCT画像から得られる構造情報と比較して、詳細な血管画像を提供する。
論文 参考訳(メタデータ) (2024-07-21T23:24:49Z) - Mask-guided cross-image attention for zero-shot in-silico histopathologic image generation with a diffusion model [0.10910416614141322]
拡散モデルは、シリコン内画像を生成する最先端のソリューションである。
自然画像の出現伝達拡散モデルが設計されている。
計算病理学、特に腫瘍学では、画像内のどのオブジェクトを前景と背景に分類すべきかを簡単に定義することはできない。
我々は,クラス固有のAdaIN特徴量マッチングを交互に行うために,外観伝達指導を変更することで,拡散安定画像への外観伝達モデルの適用性に寄与する。
論文 参考訳(メタデータ) (2024-07-16T12:36:26Z) - How to Trace Latent Generative Model Generated Images without Artificial Watermark? [88.04880564539836]
潜在生成モデルによって生成された画像に関する潜在的な誤用に関する懸念が持ち上がっている。
検査されたモデルの生成された画像をトレースするために,レイトタントトラッカーと呼ばれる潜時反転に基づく手法を提案する。
提案手法は,検査したモデルと他の画像から生成された画像とを高精度かつ効率的に識別できることを示す。
論文 参考訳(メタデータ) (2024-05-22T05:33:47Z) - Enhance Eye Disease Detection using Learnable Probabilistic Discrete Latents in Machine Learning Architectures [1.6000489723889526]
糖尿病網膜症や緑内障などの眼疾患は、公衆衛生上の重大な課題となる。
深層学習モデルは、網膜イメージングのような医療画像を分析する強力なツールとして登場した。
課題は、モデル適合性と不確実性の推定であり、これは臨床的な意思決定に不可欠である。
論文 参考訳(メタデータ) (2024-01-21T04:14:54Z) - InceptionCaps: A Performant Glaucoma Classification Model for
Data-scarce Environment [0.0]
緑内障は不可逆的な眼疾患で 世界第2位の視覚障害の原因です
本稿では,InceptionV3を畳み込みベースとしたカプセルネットワーク(CapsNet)をベースとした新しいディープラーニングモデルであるInceptionCapsを提案する。
InceptionCapsは0.956、特異性0.96、AUC0.9556を達成し、RIM-ONE v2データセット上での最先端のディープラーニングモデルのパフォーマンスを上回った。
論文 参考訳(メタデータ) (2023-11-24T11:58:11Z) - Generating Realistic Counterfactuals for Retinal Fundus and OCT Images
using Diffusion Models [36.81751569090276]
否定的推論は、意思決定の説明や代替案の定量化のために臨床現場でしばしば用いられる。
ここでは,網膜疾患分類タスクを訓練した逆向き頑健な分類器と併用した拡散モデルを用いることで,極めて現実的な対物生成が可能であることを実証する。
ユーザスタディにおいて、ドメインの専門家は、我々の手法を用いて生成された偽物は、以前の方法から生成された偽物よりもはるかに現実的であり、実際の画像と区別できないものさえ見出した。
論文 参考訳(メタデータ) (2023-11-20T09:28:04Z) - Gravity Network for end-to-end small lesion detection [50.38534263407915]
本稿では,医療画像の小さな病変を特異的に検出するワンステージエンド・ツー・エンド検出器を提案する。
小さな病変の正確な局在化は、その外観と、それらが見つかる様々な背景によって困難を呈する。
この新たなアーキテクチャをGravityNetと呼び、新しいアンカーを重力点と呼ぶ。
論文 参考訳(メタデータ) (2023-09-22T14:02:22Z) - Phenotype-preserving metric design for high-content image reconstruction
by generative inpainting [0.0]
培養細胞の高濃度蛍光顕微鏡による画像修復法について検討した。
DeepFill V2やEdge Connectのようなアーキテクチャは、比較的少ないデータで微調整することで、顕微鏡イメージを忠実に復元できることを示します。
論文 参考訳(メタデータ) (2023-07-26T18:13:16Z) - ROCT-Net: A new ensemble deep convolutional model with improved spatial
resolution learning for detecting common diseases from retinal OCT images [0.0]
本稿では,OCT画像から網膜疾患を検出するために,新たな深層アンサンブル畳み込みニューラルネットワークを提案する。
本モデルは,2つの頑健な畳み込みモデルの学習アーキテクチャを用いて,リッチかつマルチレゾリューションな特徴を生成する。
2つのデータセットに関する実験と、他のよく知られた深層畳み込みニューラルネットワークとの比較により、アーキテクチャが分類精度を最大5%向上できることが証明された。
論文 参考訳(メタデータ) (2022-03-03T17:51:01Z) - Data-driven generation of plausible tissue geometries for realistic
photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。
我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。
我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文 参考訳(メタデータ) (2021-03-29T11:30:18Z) - Multi-Disease Detection in Retinal Imaging based on Ensembling
Heterogeneous Deep Learning Models [0.0]
網膜イメージングのための革新的なマルチディセーゼ検出パイプラインを提案する。
当社のパイプラインには、転送学習、クラス重み付け、リアルタイム画像増強、焦点損失利用などの最先端の戦略が含まれます。
論文 参考訳(メタデータ) (2021-03-26T18:02:17Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Modeling and Enhancing Low-quality Retinal Fundus Images [167.02325845822276]
低画質の眼底画像は臨床観察における不確実性を高め、誤診のリスクを引き起こす。
本稿では,グローバルな劣化要因を抑えるために,臨床指向の基盤拡張ネットワーク(cofe-Net)を提案する。
合成画像と実画像の両方の実験により、我々のアルゴリズムは網膜の細部を失うことなく、低品質の眼底画像を効果的に補正することを示した。
論文 参考訳(メタデータ) (2020-05-12T08:01:16Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。