Fugu-MT 論文翻訳(概要): An Organism Starts with a Single Pix-Cell: A Neural Cellular Diffusion for High-Resolution Image Synthesis

論文の概要: An Organism Starts with a Single Pix-Cell: A Neural Cellular Diffusion for High-Resolution Image Synthesis

arxiv url: http://arxiv.org/abs/2407.03018v1
Date: Wed, 3 Jul 2024 11:26:09 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-04 14:35:46.913921
Title: An Organism Starts with a Single Pix-Cell: A Neural Cellular Diffusion for High-Resolution Image Synthesis
Title（参考訳）: 単一ピクサーセルで始める有機体:高分解能画像合成のための神経細胞拡散
Authors: Marawan Elbatel, Konstantinos Kamnitsas, Xiaomeng Li,
Abstract要約: 我々は、GeCA(Generative Cellular Automata)と呼ばれる新しいモデルのファミリーを紹介する。 GeCAは2つの画像モダリティ(Fundus and Optical Coherence Tomography, OCT)にまたがる網膜疾患分類の効果的な拡張ツールとして評価されるデータが不足し,クラス分布が本質的に歪んでいるOCT画像の文脈では,GeCAは11種類の眼科領域の性能を著しく向上させる。
参考スコア（独自算出の注目度）: 8.01395073111961
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative modeling seeks to approximate the statistical properties of real data, enabling synthesis of new data that closely resembles the original distribution. Generative Adversarial Networks (GANs) and Denoising Diffusion Probabilistic Models (DDPMs) represent significant advancements in generative modeling, drawing inspiration from game theory and thermodynamics, respectively. Nevertheless, the exploration of generative modeling through the lens of biological evolution remains largely untapped. In this paper, we introduce a novel family of models termed Generative Cellular Automata (GeCA), inspired by the evolution of an organism from a single cell. GeCAs are evaluated as an effective augmentation tool for retinal disease classification across two imaging modalities: Fundus and Optical Coherence Tomography (OCT). In the context of OCT imaging, where data is scarce and the distribution of classes is inherently skewed, GeCA significantly boosts the performance of 11 different ophthalmological conditions, achieving a 12% increase in the average F1 score compared to conventional baselines. GeCAs outperform both diffusion methods that incorporate UNet or state-of-the art variants with transformer-based denoising models, under similar parameter constraints. Code is available at: https://github.com/xmed-lab/GeCA.
Abstract（参考訳）: 生成モデリングは、実際のデータの統計特性を近似し、元の分布によく似た新しいデータの合成を可能にする。 Generative Adversarial Networks (GANs) と Denoising Diffusion Probabilistic Models (DDPMs) は、それぞれゲーム理論と熱力学からインスピレーションを得ている。しかしながら、生物進化のレンズによる生成的モデリングの探索は、ほとんど未解決のままである。本稿では,単一細胞からの生物の進化に触発されたGeCA(Generative Cellular Automata)と呼ばれる新しいモデル群を紹介する。 GeCAは、Fundus と Optical Coherence Tomography (OCT) の2つの画像モダリティにおいて、網膜疾患分類のための効果的な拡張ツールとして評価されている。データが不足し,クラス分布が本質的に歪んでいるOCT画像の文脈では,GeCAは従来のベースラインに比べて平均F1スコアが12%増加し,11種類の眼科的条件の性能を著しく向上させる。 GeCAは、同様なパラメータ制約の下で、UNetを組み込んだ拡散法と、トランスフォーマーベースのデノナイジングモデルで最先端のアート変種の両方を上回ります。コードは、https://github.com/xmed-lab/GeCA.comで入手できる。

関連論文リスト

DGSSA: Domain generalization with structural and stylistic augmentation for retinal vessel segmentation [17.396365010722423]
網膜血管形態は糖尿病、緑内障、高血圧などの疾患の診断に重要である。従来のセグメンテーション手法は、トレーニングとテストのデータが同様の分布を共有していると仮定する。本稿では,網膜血管画像分割のための新しいアプローチ DGSSA を提案する。
論文参考訳（メタデータ） (2025-01-07T01:47:57Z)
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文参考訳（メタデータ） (2024-12-30T01:59:34Z)
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文参考訳（メタデータ） (2024-03-19T09:28:19Z)
Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文参考訳（メタデータ） (2024-02-16T16:47:21Z)
Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文参考訳（メタデータ） (2023-10-22T02:27:02Z)
Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文参考訳（メタデータ） (2023-10-10T14:37:17Z)
Adaptive Input-image Normalization for Solving the Mode Collapse Problem in GAN-based X-ray Images [0.08192907805418582]
この研究は、適応入力-画像正規化をDeep Conversaal GANとAuxiliary GANと統合してモード崩壊問題を緩和する利点の実証的な実証に寄与する。その結果, 適応入出力正規化によるDCGANとACGANは, 非正規化X線画像でDCGANとACGANより優れていた。
論文参考訳（メタデータ） (2023-09-21T16:43:29Z)
Classification of lung cancer subtypes on CT images with synthetic pathological priors [41.75054301525535]
同症例のCT像と病理像との間には,画像パターンに大規模な関連性が存在する。肺がんサブタイプをCT画像上で正確に分類するための自己生成型ハイブリッド機能ネットワーク(SGHF-Net)を提案する。
論文参考訳（メタデータ） (2023-08-09T02:04:05Z)
An Attentive-based Generative Model for Medical Image Synthesis [18.94900480135376]
注意に基づく二重コントラスト生成モデルであるADC-cycleGANを提案する。このモデルは、二重コントラスト損失項とCycleGAN損失を統合し、合成された画像がソース領域と区別可能であることを保証する。実験により,提案したADCサイクルGANモデルが,他の最先端生成モデルに匹敵するサンプルを生成することが示された。
論文参考訳（メタデータ） (2023-06-02T14:17:37Z)
ViT-DAE: Transformer-driven Diffusion Autoencoder for Histopathology Image Analysis [4.724009208755395]
高品質な病理画像合成のための視覚変換器(ViT)と拡散オートエンコーダを統合したViT-DAEを提案する。提案手法は, 実写画像生成におけるGAN法とバニラDAE法より優れている。
論文参考訳（メタデータ） (2023-04-03T15:00:06Z)
Unified Framework for Histopathology Image Augmentation and Classification via Generative Models [6.404713841079193]
本稿では,データ生成とモデルトレーニングの段階を統一プロセスに統合する,革新的な統一フレームワークを提案する。提案手法では、画像合成と分類の両方を同時に扱うために、純粋視覚変換器(ViT)ベースの条件付き生成適応ネットワーク(cGAN)モデルを用いる。本実験により,我々の統合合成増強フレームワークは,病理組織像分類モデルの性能を一貫して向上させることが示された。
論文参考訳（メタデータ） (2022-12-20T03:40:44Z)
A multi-stage machine learning model on diagnosis of esophageal manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文参考訳（メタデータ） (2021-06-25T20:09:23Z)
Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文参考訳（メタデータ） (2021-02-26T02:29:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。