論文の概要: NeuroSeg Meets DINOv3: Transferring 2D Self-Supervised Visual Priors to 3D Neuron Segmentation via DINOv3 Initialization
- arxiv url: http://arxiv.org/abs/2603.23104v1
- Date: Tue, 24 Mar 2026 11:52:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.458604
- Title: NeuroSeg Meets DINOv3: Transferring 2D Self-Supervised Visual Priors to 3D Neuron Segmentation via DINOv3 Initialization
- Title(参考訳): NeuroSegとDINOv3 : DINOv3初期化による2D自己スーパービジョン視覚の3Dニューロンセグメンテーションへの移行
- Authors: Yik San Cheng, Runkai Zhao, Weidong Cai,
- Abstract要約: 本稿では,DINOv3が学習した2次元視覚表現を3次元バイオメディカルセグメンテーションモデルに適用することを提案する。
具体的には,2次元フィルタを3次元演算子に膨らませ,DINOv3からのセマンティックな事前情報を保存するインフレーションに基づく適応戦略を設計する。
さらに, トポロジを意識した骨格損失を導入し, グラフベース神経アーバー再構築の構造的忠実度を明示する。
- 参考スコア(独自算出の注目度): 8.942649901923332
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 2D visual foundation models, such as DINOv3, a self-supervised model trained on large-scale natural images, have demonstrated strong zero-shot generalization, capturing both rich global context and fine-grained structural cues. However, an analogous 3D foundation model for downstream volumetric neuroimaging remains lacking, largely due to the challenges of 3D image acquisition and the scarcity of high-quality annotations. To address this gap, we propose to adapt the 2D visual representations learned by DINOv3 to a 3D biomedical segmentation model, enabling more data-efficient and morphologically faithful neuronal reconstruction. Specifically, we design an inflation-based adaptation strategy that inflates 2D filters into 3D operators, preserving semantic priors from DINOv3 while adapting to 3D neuronal volume patches. In addition, we introduce a topology-aware skeleton loss to explicitly enforce structural fidelity of graph-based neuronal arbor reconstruction. Extensive experiments on four neuronal imaging datasets, including two from BigNeuron and two public datasets, NeuroFly and CWMBS, demonstrate consistent improvements in reconstruction accuracy over SoTA methods, with average gains of 2.9% in Entire Structure Average, 2.8% in Different Structure Average, and 3.8% in Percentage of Different Structure. Code: https://github.com/yy0007/NeurINO.
- Abstract(参考訳): 大規模自然画像に基づいて訓練された自己教師型モデルであるDINOv3のような2次元視覚基盤モデルは、強力なゼロショットの一般化を示し、豊かなグローバルコンテキストときめ細かい構造的手がかりの両方を捉えている。
しかし、3D画像取得の課題や高品質なアノテーションの不足などにより、下流のボリューム・ニューロイメージングに類似した3D基盤モデルが欠落している。
このギャップに対処するため,DINOv3が学習した2次元視覚表現を3次元バイオメディカルセグメンテーションモデルに適用し,よりデータ効率が高く,形態的に忠実な神経細胞再構築を可能にすることを提案する。
具体的には,DINOv3からのセマンティック先行を3次元ニューロンボリュームパッチに適応させながら,2次元フィルタを3次元演算子に膨らませるインフレーションベースの適応戦略を設計する。
さらに, トポロジを意識した骨格損失を導入し, グラフベース神経アーバー再構築の構造的忠実度を明示する。
BigNeuronとNeuroFlyとCWMBSの2つの公開データセットを含む4つの画像データセットに関する大規模な実験は、SoTA法よりも一貫した再構築精度の向上を示しており、平均的な構造平均は2.9%、異なる構造平均は2.8%、異なる構造の割合は3.8%である。
コード:https://github.com/yy0007/NeurINO。
関連論文リスト
- DSplats: 3D Generation by Denoising Splats-Based Multiview Diffusion Models [67.50989119438508]
本稿では,ガウスをベースとしたレコンストラクタを用いて,リアルな3Dアセットを生成することで,マルチビュー画像を直接認識するDSplatを紹介した。
実験の結果,DSplatsは高品質で空間的に一貫した出力を生成できるだけでなく,単一画像から3次元再構成への新たな標準も設定できることがわかった。
論文 参考訳(メタデータ) (2024-12-11T07:32:17Z) - DINeuro: Distilling Knowledge from 2D Natural Images via Deformable Tubular Transferring Strategy for 3D Neuron Reconstruction [10.100192103585925]
3D光顕微鏡画像データからニューロンの形態を再構築することは、神経科学者が脳ネットワークや神経解剖学を分析するのを助けるために重要である。
本稿では, 潜伏埋め込み空間における神経構造固有の管状特性に, 事前学習した2次元自然知識を適応させる変形可能な管状伝達戦略を提案する。
論文 参考訳(メタデータ) (2024-10-29T14:36:03Z) - GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction [52.04103235260539]
単一視点からの3次元オブジェクト再構成のためのガウススプティング表現に基づく拡散モデル手法を提案する。
モデルはGS楕円体の集合で表される3Dオブジェクトを生成することを学習する。
最終的な再構成されたオブジェクトは、高品質な3D構造とテクスチャを持ち、任意のビューで効率的にレンダリングできる。
論文 参考訳(メタデータ) (2024-07-05T03:43:08Z) - Boosting 3D Neuron Segmentation with 2D Vision Transformer Pre-trained on Natural Images [10.790999324557179]
本研究では,大規模自然画像に事前学習した2次元視覚変換器モデルを活用する新しい訓練パラダイムを提案する。
本手法は,3次元ニューロンセグメンテーション能力を向上させるために,豊富な自然と希少なニューロン画像領域間の知識共有接続を構築する。
一般的なベンチマークであるBigNeuronで評価したところ、スクラッチからトレーニングしたモデルよりもニューロンのセグメンテーション性能が8.71%向上した。
論文 参考訳(メタデータ) (2024-05-04T14:57:28Z) - Decomposing 3D Neuroimaging into 2+1D Processing for Schizophrenia
Recognition [25.80846093248797]
我々は2+1Dフレームワークで3Dデータを処理し、巨大なImageNetデータセット上に事前トレーニングされた強力な2D畳み込みニューラルネットワーク(CNN)ネットワークを利用して3Dニューロイメージング認識を実現することを提案する。
特に3次元磁気共鳴イメージング(MRI)の計測値は、隣接するボクセル位置に応じて2次元スライスに分解される。
グローバルプーリングは、アクティベーションパターンが機能マップ上にわずかに分散されているため、冗長な情報を除去するために適用される。
2次元CNNモデルにより処理されていない3次元の文脈情報を集約するために,チャネルワイドおよびスライスワイズ畳み込みを提案する。
論文 参考訳(メタデータ) (2022-11-21T15:22:59Z) - Deep Generative Models on 3D Representations: A Survey [81.73385191402419]
生成モデルは、新しいインスタンスを生成することによって観測データの分布を学習することを目的としている。
最近、研究者は焦点を2Dから3Dにシフトし始めた。
3Dデータの表現は、非常に大きな課題をもたらします。
論文 参考訳(メタデータ) (2022-10-27T17:59:50Z) - BNV-Fusion: Dense 3D Reconstruction using Bi-level Neural Volume Fusion [85.24673400250671]
ニューラル・ボリューム・フュージョン (BNV-Fusion) は, ニューラル・暗黙表現とニューラル・レンダリングの最近の進歩を活用して高密度3次元再構成を行う。
新しい深度マップをグローバルな暗黙的表現に漸進的に統合するために、我々は新しい二段階融合戦略を提案する。
提案手法を定量的に定性的に評価し,既存手法よりも有意な改善を示した。
論文 参考訳(メタデータ) (2022-04-03T19:33:09Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。