論文の概要: ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models
- arxiv url: http://arxiv.org/abs/2309.01111v1
- Date: Sun, 3 Sep 2023 07:55:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 21:21:52.006418
- Title: ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models
- Title(参考訳): ArSDM:適応リファインメント・セマンティック拡散モデルを用いた大腸内視鏡画像合成
- Authors: Yuhao Du, Yuncheng Jiang, Shuangyi Tan, Xusheng Wu, Qi Dou, Zhen Li,
Guanbin Li, Xiang Wan
- Abstract要約: 大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
- 参考スコア(独自算出の注目度): 69.9178140563928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Colonoscopy analysis, particularly automatic polyp segmentation and
detection, is essential for assisting clinical diagnosis and treatment.
However, as medical image annotation is labour- and resource-intensive, the
scarcity of annotated data limits the effectiveness and generalization of
existing methods. Although recent research has focused on data generation and
augmentation to address this issue, the quality of the generated data remains a
challenge, which limits the contribution to the performance of subsequent
tasks. Inspired by the superiority of diffusion models in fitting data
distributions and generating high-quality data, in this paper, we propose an
Adaptive Refinement Semantic Diffusion Model (ArSDM) to generate colonoscopy
images that benefit the downstream tasks. Specifically, ArSDM utilizes the
ground-truth segmentation mask as a prior condition during training and adjusts
the diffusion loss for each input according to the polyp/background size ratio.
Furthermore, ArSDM incorporates a pre-trained segmentation model to refine the
training process by reducing the difference between the ground-truth mask and
the prediction mask. Extensive experiments on segmentation and detection tasks
demonstrate the generated data by ArSDM could significantly boost the
performance of baseline methods.
- Abstract(参考訳): 大腸内視鏡検査,特にポリープの自動分画と検出は臨床診断と治療の補助に不可欠である。
しかし, 医用画像アノテーションは労働集約的かつ資源集約的であるため, 注釈付きデータの不足は既存の手法の有効性と一般化を制限している。
最近の研究は、この問題に対処するためにデータ生成と拡張に焦点を当てているが、生成されたデータの品質は依然として課題であり、その後のタスクのパフォーマンスへの貢献を制限する。
本稿では,データ分布の適合や高品質なデータ生成における拡散モデルの優位性に着想を得て,下流の作業に有利な大腸内視鏡画像を生成するための適応リファインメント・セマンティック拡散モデル(ArSDM)を提案する。
具体的には、ArSDMは、トレーニング中にグラウントトラスセグメンテーションマスクを事前条件として使用し、ポリプ/バックグラウンドサイズ比に応じて各入力の拡散損失を調整する。
さらに、arsdmは事前訓練されたセグメンテーションモデルを採用しており、接地マスクと予測マスクとの差を低減し、トレーニングプロセスを洗練している。
セグメンテーションと検出タスクに関する大規模な実験は、ArSDMが生成したデータをベースライン法の性能を大幅に向上させることを示した。
関連論文リスト
- Adaptive Distribution Masked Autoencoders for Continual Test-Time
Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - EMIT-Diff: Enhancing Medical Image Segmentation via Text-Guided
Diffusion Model [4.057796755073023]
EMIT-Diffと呼ばれる医用画像合成のための制御可能な拡散モデルを開発した。
近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。
提案手法では, 合成試料が医療上の制約に適合することを確実にする。
論文 参考訳(メタデータ) (2023-10-19T16:18:02Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Assessing the capacity of a denoising diffusion probabilistic model to
reproduce spatial context [7.289988602420457]
拡散確率モデル(DDPM)は生成逆数ネットワーク(GAN)と比較して画像合成性能が優れていることを示す
これらの主張は、自然画像用に設計されたアンサンブルベースの手法や、構造的類似性などの画像品質の従来の尺度を用いて評価されている。
本研究は,空間文脈学習におけるDDPMの能力に関する新たな重要な知見を明らかにするものである。
論文 参考訳(メタデータ) (2023-09-19T17:58:35Z) - In-context Cross-Density Adaptation on Noisy Mammogram Abnormalities
Detection [0.4433315630787158]
本稿では,乳房密度分布が深層学習モデルの一般化性能に及ぼす影響をマンモグラフィー画像で検討する。
本稿では,データセット内のソースとターゲット間のドメインギャップを埋める,堅牢な拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-12T06:46:42Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - About Explicit Variance Minimization: Training Neural Networks for
Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。
多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文 参考訳(メタデータ) (2021-05-28T21:34:04Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z) - Cross-Domain Segmentation with Adversarial Loss and Covariate Shift for
Biomedical Imaging [2.1204495827342438]
本論文は,異なるモダリティから異なるパターンと共有パターンをカプセル化することにより,ドメイン間データから堅牢な表現を学習できる新しいモデルの実現を目的とする。
正常な臨床試験で得られたCTおよびMRI肝データに対する試験は、提案したモデルが他のすべてのベースラインを大きなマージンで上回っていることを示している。
論文 参考訳(メタデータ) (2020-06-08T07:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。