論文の概要: Diffusion Model-Based Data Augmentation for Enhanced Neuron Segmentation
- arxiv url: http://arxiv.org/abs/2601.15779v1
- Date: Thu, 22 Jan 2026 09:12:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.55519
- Title: Diffusion Model-Based Data Augmentation for Enhanced Neuron Segmentation
- Title(参考訳): 拡散モデルに基づく高次ニューロンセグメンテーションのためのデータ拡張
- Authors: Liuyun Jiang, Yanchao Zhang, Jinyue Guo, Yizhuo Lu, Ruining Zhou, Hua Han,
- Abstract要約: 現在のディープラーニングベースの手法は、大規模なトレーニングデータと、広範囲で時間を要するマニュアルアノテーションに依存しているため、制限されている。
本稿では,多種多様かつ構造的に妥当な画像ラベルペアを生成することができる拡散型データ拡張フレームワークを提案する。
提案手法は, 2つの異なる後処理法と組み合わせることで, それぞれ32.1%, 30.7%向上する。
- 参考スコア(独自算出の注目度): 7.83854380301501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neuron segmentation in electron microscopy (EM) aims to reconstruct the complete neuronal connectome; however, current deep learning-based methods are limited by their reliance on large-scale training data and extensive, time-consuming manual annotations. Traditional methods augment the training set through geometric and photometric transformations; however, the generated samples remain highly correlated with the original images and lack structural diversity. To address this limitation, we propose a diffusion-based data augmentation framework capable of generating diverse and structurally plausible image-label pairs for neuron segmentation. Specifically, the framework employs a resolution-aware conditional diffusion model with multi-scale conditioning and EM resolution priors to enable voxel-level image synthesis from 3D masks. It further incorporates a biology-guided mask remodeling module that produces augmented masks with enhanced structural realism. Together, these components effectively enrich the training set and improve segmentation performance. On the AC3 and AC4 datasets under low-annotation regimes, our method improves the ARAND metric by 32.1% and 30.7%, respectively, when combined with two different post-processing methods. Our code is available at https://github.com/HeadLiuYun/NeuroDiff.
- Abstract(参考訳): 電子顕微鏡(EM)におけるニューロン分割は、完全な神経細胞コネクトームを再構築することを目的としているが、現在のディープラーニングベースの手法は、大規模なトレーニングデータと広範囲で時間を要するマニュアルアノテーションに依存しているため、制限されている。
従来の方法では、幾何学的および測光的変換によってトレーニングセットを増強するが、生成されたサンプルは元の画像と強く相関し、構造的な多様性が欠如している。
この制限に対処するために,ニューロンセグメンテーションのための多種多様かつ構造的に妥当な画像ラベルペアを生成することができる拡散ベースのデータ拡張フレームワークを提案する。
具体的には,3次元マスクからボクセルレベルの画像合成を可能にするために,マルチスケール条件付けとEM分解能を先行した高分解能条件拡散モデルを用いる。
さらに、構造的リアリズムが強化された拡張マスクを生成する、生物学誘導マスクリモデリングモジュールも組み込まれている。
これらのコンポーネントは、トレーニングセットを効果的に強化し、セグメンテーション性能を向上させる。
低アノテーション条件下でのAC3とAC4のデータセットでは,2つの異なる後処理法と組み合わせることで,ARANDの計測値が32.1%,30.7%向上する。
私たちのコードはhttps://github.com/HeadLiuYun/NeuroDiff.comで公開されています。
関連論文リスト
- A New One-Shot Federated Learning Framework for Medical Imaging Classification with Feature-Guided Rectified Flow and Knowledge Distillation [13.353672721534627]
ワンショットフェデレートラーニング(OSFL)は,通信オーバーヘッドの低さから注目を集めている。
既存の生成モデルベースのOSFLメソッドは、トレーニング効率の低下と、医療領域における潜在的なプライバシー漏洩に悩まされている。
本稿では,新しいFG-RF(Feature-Guided Rectified Flow Model)とDLKD(Dual-Layer Knowledge Distillation)アグリゲーション手法を開発したOSFLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-25T08:05:47Z) - Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。
Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文 参考訳(メタデータ) (2025-06-24T17:58:02Z) - ShapeMamba-EM: Fine-Tuning Foundation Model with Local Shape Descriptors and Mamba Blocks for 3D EM Image Segmentation [49.42525661521625]
本稿では3次元EMセグメンテーションのための特殊微調整法であるShapeMamba-EMを提案する。
5つのセグメンテーションタスクと10のデータセットをカバーする、幅広いEMイメージでテストされている。
論文 参考訳(メタデータ) (2024-08-26T08:59:22Z) - Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes [2.8498944632323755]
医用画像分割のためのエンドツーエンドハイブリッドアーキテクチャを提案する。
ハミルトン変分オートエンコーダ(HVAE)と識別正則化を用いて生成画像の品質を向上する。
我々のアーキテクチャはスライス・バイ・スライス・ベースで3Dボリュームを分割し、リッチな拡張データセットをカプセル化する。
論文 参考訳(メタデータ) (2024-06-17T15:42:08Z) - 3D MRI Synthesis with Slice-Based Latent Diffusion Models: Improving Tumor Segmentation Tasks in Data-Scarce Regimes [2.8498944632323755]
本稿では,ボリュームデータ生成の複雑さに対処するスライスに基づく遅延拡散アーキテクチャを提案する。
この手法は,医療用画像と関連するマスクの同時分布モデルを拡張し,データスカース体制下での同時生成を可能にする。
構造は, 大きさ, 形状, 相対位置などの腫瘍特性によって調節できるため, 腫瘍の多様性は様々である。
論文 参考訳(メタデータ) (2024-06-08T09:53:45Z) - NeuroPictor: Refining fMRI-to-Image Reconstruction via Multi-individual Pretraining and Multi-level Modulation [55.51412454263856]
本稿では,fMRI信号を用いた拡散モデル生成過程を直接変調することを提案する。
様々な個人から約67,000 fMRI-imageペアのトレーニングを行うことで,fMRI-to-imageデコーディング能力に優れたモデルが得られた。
論文 参考訳(メタデータ) (2024-03-27T02:42:52Z) - HybridMIM: A Hybrid Masked Image Modeling Framework for 3D Medical Image
Segmentation [29.15746532186427]
HybridMIMは3次元医用画像セグメンテーションのためのマスク付き画像モデリングに基づく新しいハイブリッド自己教師型学習手法である。
医用画像の意味情報を3段階に分けて学習し,1)3次元画像の重要な内容を再構成する部分領域予測を行うことにより,トレーニング前の時間負担を大幅に軽減する。
提案するフレームワークは,エンコーダバックボーンとしてCNNとトランスフォーマーの両方をサポートするとともに,イメージセグメンテーションのためのデコーダの事前トレーニングも可能である。
論文 参考訳(メタデータ) (2023-03-18T04:43:12Z) - Automatic size and pose homogenization with spatial transformer network
to improve and accelerate pediatric segmentation [51.916106055115755]
空間変換器ネットワーク(STN)を利用することにより、ポーズとスケール不変の新たなCNNアーキテクチャを提案する。
私たちのアーキテクチャは、トレーニング中に一緒に見積もられる3つのシーケンシャルモジュールで構成されています。
腹部CTスキャナーを用いた腎および腎腫瘍の分節法について検討した。
論文 参考訳(メタデータ) (2021-07-06T14:50:03Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Brain segmentation based on multi-atlas guided 3D fully convolutional
network ensembles [1.52292571922932]
構造磁気共鳴画像(MRI)から関心領域(ROI)を抽出するためのマルチアトラスガイド3次元完全畳み込みネットワーク(FCN)アンサンブルモデル(M-FCN)を提案し,検証した。
我々は、各ROIの3次元FCNモデルを、適応サイズのパッチとデコンボリューション層内の畳み込み層の組込み出力を用いて訓練し、局所的およびグローバルなコンテキストパターンをさらに捉えた。
その結果,提案手法はセグメンテーション性能に優れていた。
論文 参考訳(メタデータ) (2019-01-05T08:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。