論文の概要: Unsupervised Discovery of 3D Hierarchical Structure with Generative
Diffusion Features
- arxiv url: http://arxiv.org/abs/2305.00067v1
- Date: Fri, 28 Apr 2023 19:37:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 17:29:11.078367
- Title: Unsupervised Discovery of 3D Hierarchical Structure with Generative
Diffusion Features
- Title(参考訳): 生成拡散特徴を持つ3次元階層構造の教師なし発見
- Authors: Nurislam Tursynbek, Marc Niethammer
- Abstract要約: 拡散モデルの特徴は3次元バイオメディカル画像において異なる階層レベルを捉えている。
我々は3次元ボリュームを意味のあるネストされたサブボリュームに分解することを奨励する予測的教師なしセグメンテーションネットワークを訓練する。
われわれのモデルは、既存の教師なし構造発見手法よりも、難解な合成データセットや現実世界の脳腫瘍MRIデータセットよりも優れた性能を達成している。
- 参考スコア(独自算出の注目度): 21.1242488304767
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inspired by recent findings that generative diffusion models learn
semantically meaningful representations, we use them to discover the intrinsic
hierarchical structure in biomedical 3D images using unsupervised segmentation.
We show that features of diffusion models from different stages of a
U-Net-based ladder-like architecture capture different hierarchy levels in 3D
biomedical images. We design three losses to train a predictive unsupervised
segmentation network that encourages the decomposition of 3D volumes into
meaningful nested subvolumes that represent a hierarchy. First, we pretrain 3D
diffusion models and use the consistency of their features across subvolumes.
Second, we use the visual consistency between subvolumes. Third, we use the
invariance to photometric augmentations as a regularizer. Our models achieve
better performance than prior unsupervised structure discovery approaches on
challenging biologically-inspired synthetic datasets and on a real-world brain
tumor MRI dataset.
- Abstract(参考訳): 生成拡散モデルが意味論的に意味のある表現を学習する最近の知見に触発されて,非教師なしセグメンテーションを用いた生体医用3次元画像の内在的階層構造を発見する。
U-Netベースのはしご型アーキテクチャの異なる段階からの拡散モデルの特徴は、生体医用画像の様々な階層レベルをキャプチャする。
我々は3つの損失を予測的教師なしセグメンテーションネットワークのトレーニングとして設計し、3次元ボリュームを階層を表す意味のあるネスト付きサブボリュームに分解することを奨励する。
まず,3次元拡散モデルを事前学習し,サブボリュームにまたがる特徴の一貫性を利用する。
第二に、サブボリューム間の視覚的整合性を利用する。
第3に、光度増倍に対する不変性を正則化として用いる。
我々のモデルは、生物学的にインスパイアされた合成データセットと現実世界の脳腫瘍MRIデータセットに挑戦する、教師なし構造発見アプローチよりも優れたパフォーマンスを実現する。
関連論文リスト
- DiHuR: Diffusion-Guided Generalizable Human Reconstruction [51.31232435994026]
一般化可能なヒト3次元再構成のための拡散誘導モデルであるDiHuRを導入し,スパース・ミニマル・オーバーラップ画像からのビュー合成について述べる。
提案手法は, 一般化可能なフィードフォワードモデルと2次元拡散モデルとの2つのキー前処理をコヒーレントな方法で統合する。
論文 参考訳(メタデータ) (2024-11-16T03:52:23Z) - Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image [94.56927147492738]
単一画像から幾何学的属性を推定するための新しい生成基盤モデルであるGeoWizardを紹介する。
拡散前処理の活用は,資源利用における一般化,詳細な保存,効率性を著しく向上させることが示唆された。
本稿では,様々なシーンの複雑なデータ分布を,個別のサブディストリビューションに分離する,シンプルかつ効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-03-18T17:50:41Z) - A Generative Machine Learning Model for Material Microstructure 3D
Reconstruction and Performance Evaluation [4.169915659794567]
2次元から3次元への次元展開は、現在の技術的観点から非常に難しい逆問題と見なされている。
U-netのマルチスケール特性とGANの生成能力を統合する新しい生成モデルが提案されている。
さらに、画像正規化損失とワッサーシュタイン距離損失を組み合わせることにより、モデルの精度をさらに向上する。
論文 参考訳(メタデータ) (2024-02-24T13:42:34Z) - Self-Supervised Representation Learning for Nerve Fiber Distribution
Patterns in 3D-PLI [36.136619420474766]
3D-PLI(3D-PLI)は、高分解能の髄質神経線維の微細構造を観察できる顕微鏡イメージング技術である。
3D-PLIにおけるファイバアーキテクチャのオブザーバ非依存的特徴付けのためのベストプラクティスはまだ提供されていない。
自己教師付き表現学習を用いた3次元PLI画像における神経線維構造を特徴付けるための完全データ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2024-01-30T17:49:53Z) - StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。
まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。
第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文 参考訳(メタデータ) (2023-12-02T02:27:58Z) - Lymphoma segmentation from 3D PET-CT images using a deep evidential
network [20.65641432056608]
3Dポジトロン・エミッション・トモグラフィ(PET)画像とCT画像から悪性リンパ腫を分離するために, 自動顕在性セグメンテーション法を提案する。
アーキテクチャは、深い特徴抽出モジュールと明らかな層から構成される。
提案手法の深部特徴抽出と明らかなセグメンテーションの組み合わせは,ベースラインUNetモデルより優れていることを示す。
論文 参考訳(メタデータ) (2022-01-31T09:34:38Z) - Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。
この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。
本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T15:09:03Z) - Learning Hyperbolic Representations for Unsupervised 3D Segmentation [3.516233423854171]
本稿では,双曲型潜在空間を持つ変分オートエンコーダ(VAE)とジャイロプレーン畳み込み層を用いて,教師なしセグメンテーションのための3次元パッチの効果的表現を提案する。
階層型トイデータセット,BraTS全腫瘍データセット,低温電子顕微鏡データを用いた非教師なし3次元セグメンテーションにおけるハイパーボリック表現の有効性を実証した。
論文 参考訳(メタデータ) (2020-12-03T02:15:31Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。