論文の概要: FDIF: Formula-Driven supervised Learning with Implicit Functions for 3D Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2603.23199v1
- Date: Tue, 24 Mar 2026 13:45:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.504104
- Title: FDIF: Formula-Driven supervised Learning with Implicit Functions for 3D Medical Image Segmentation
- Title(参考訳): FDIF: 3次元医用画像セグメンテーションのための命令関数を用いたフォーミュラ駆動型教師あり学習
- Authors: Yukinori Yamamoto, Kazuya Nishimura, Tsukasa Fukusato, Hirokazu Nosato, Tetsuya Ogata, Hirokatsu Kataoka,
- Abstract要約: ディープラーニングに基づく3D医療画像セグメンテーション手法は、大規模ラベル付きデータセットに依存している。
フォーミュラ駆動型スーパービジョン学習法は, 数式から直接トレーニングデータとラベルを生成することで, 魅力的な代替手段を提供する。
実データや医療専門家のアノテーションを使わずに、スケーラブルな事前学習を可能にするフレームワークである、Implicit Functions (FDIF) を用いたフォーミュラ駆動型教師あり学習を紹介する。
- 参考スコア(独自算出の注目度): 15.58096401866496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based 3D medical image segmentation methods relies on large-scale labeled datasets, yet acquiring such data is difficult due to privacy constraints and the high cost of expert annotation. Formula-Driven Supervised Learning (FDSL) offers an appealing alternative by generating training data and labels directly from mathematical formulas. However, existing voxel-based approaches are limited in geometric expressiveness and cannot synthesize realistic textures. We introduce Formula-Driven supervised learning with Implicit Functions (FDIF), a framework that enables scalable pre-training without using any real data and medical expert annotations. FDIF introduces an implicit-function representation based on signed distance functions (SDFs), enabling compact modeling of complex geometries while exploiting the surface representation of SDFs to support controllable synthesis of both geometric and intensity textures. Across three medical image segmentation benchmarks (AMOS, ACDC, and KiTS) and three architectures (SwinUNETR, nnUNet ResEnc-L, and nnUNet Primus-M), FDIF consistently improves over a formula-driven method, and achieves performance comparable to self-supervised approaches pre-trained on large-scale real datasets. We further show that FDIF pre-training also benefits 3D classification tasks, highlighting implicit-function-based formula supervision as a promising paradigm for data-free representation learning. Code is available at https://github.com/yamanoko/FDIF.
- Abstract(参考訳): ディープラーニングに基づく3次元医用画像分割手法は,大規模ラベル付きデータセットに依存するが,プライバシー上の制約や専門家アノテーションのコストが高いため,そのようなデータを取得することは困難である。
フォーミュラ駆動監視学習(FDSL)は、数式から直接トレーニングデータとラベルを生成することで、魅力的な代替手段を提供する。
しかし、既存のボクセルベースのアプローチは幾何学的表現性に制限があり、現実的なテクスチャを合成することはできない。
実データや医療専門家のアノテーションを使わずに、スケーラブルな事前学習を可能にするフレームワークである、Implicit Functions (FDIF) を用いたフォーミュラ駆動型教師あり学習を紹介した。
FDIFは符号付き距離関数(SDF)に基づく暗黙関数表現を導入し、SDFの表面表現を活用しながら複雑なジオメトリのコンパクトなモデリングを可能にし、幾何学的および強度的テクスチャの制御可能な合成を支援する。
3つの医用画像セグメンテーションベンチマーク(AMOS, ACDC, KiTS)と3つのアーキテクチャ(SwinUNETR, nnUNet ResEnc-L, nnUNet Primus-M)で、FDIFは式駆動方式よりも一貫して改善され、大規模な実データセットで事前訓練された自己監督アプローチに匹敵するパフォーマンスを達成する。
さらに,FDIF事前学習は,データ自由表現学習における有望なパラダイムとして,暗黙の関数に基づく公式管理を強調することで,3次元分類作業にも有効であることを示す。
コードはhttps://github.com/yamanoko/FDIF.comで入手できる。
関連論文リスト
- Unified Molecule Pre-training with Flexible 2D and 3D Modalities: Single and Paired Modality Integration [15.929511077091687]
単一モード入力をサポートしながら統一的な分子表現を学習するフレキシブル分子事前学習フレームワークFlexMolを提案する。
提案手法では,2次元および3次元分子データに対して異なるモデルを用い,パラメータ共有を利用して計算効率を向上し,デコーダを用いて欠落したモダリティの特徴を生成する。
論文 参考訳(メタデータ) (2025-10-08T14:02:51Z) - SPHERE: Semantic-PHysical Engaged REpresentation for 3D Semantic Scene Completion [52.959716866316604]
カメラベース3Dセマンティックシーンコンプリート(SSC)は自動運転システムにおいて重要な課題である。
本稿では,SPHERE (Semantic-PHysical Engaged Representation) を提案する。
SPHEREは、意味情報と物理的情報の共同利用のためのボクセルとガウス表現を統合している。
論文 参考訳(メタデータ) (2025-09-14T09:07:41Z) - NF-SLAM: Effective, Normalizing Flow-supported Neural Field representations for object-level visual SLAM in automotive applications [20.963261049295085]
暗黙的な符号付き距離関数による3次元形状を表現する自動車アプリケーションのための視覚のみのオブジェクトレベルSLAMフレームワークを提案する。
私たちの重要なイノベーションは、正規化フローネットワークによる標準神経表現の増強です。
新たに提案されたアーキテクチャは、スパースデータとノイズデータのみの存在下での大幅な性能向上を示す。
論文 参考訳(メタデータ) (2025-03-14T08:46:56Z) - DeepFRC: An End-to-End Deep Learning Model for Functional Registration and Classification [11.194964108429252]
DeepFRCは、ワープ機能と統一アーキテクチャ内の分類を共同で学習するエンドツーエンドのディープラーニングフレームワークである。
このようなジョイントモデルに対する最初の理論的保証を提供し、最適なワープを近似する能力を証明する。
合成および実世界のデータセットの実験により、DeepFRCは、アライメント品質と分類精度の両方において、最先端の手法を一貫して上回っていることが示された。
論文 参考訳(メタデータ) (2025-01-30T03:35:03Z) - Few-Shot Unsupervised Implicit Neural Shape Representation Learning with Spatial Adversaries [8.732260277121547]
Inlicit Neural Representationsは、複雑なデータモダリティをキャプチャする強力なフレームワークとして注目されている。
3次元形状表現の領域内では、ニューラルネットワーク符号距離関数(SDF)は複雑な形状幾何を忠実に符号化する顕著な可能性を示している。
論文 参考訳(メタデータ) (2024-08-27T14:54:33Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Surf-D: Generating High-Quality Surfaces of Arbitrary Topologies Using Diffusion Models [83.35835521670955]
Surf-Dは任意の位相を持つ表面として高品質な3次元形状を生成する新しい方法である。
非符号距離場(UDF)を曲面表現として用いて任意の位相を許容する。
また、ポイントベースのAutoEncoderを用いて、UDFを正確に符号化するためのコンパクトで連続的な潜在空間を学習する新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2023-11-28T18:56:01Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Representation-Agnostic Shape Fields [43.123829024621514]
本稿では,3次元深層学習のための汎用的で計算効率の良い形状埋め込みモジュールであるRepresentation-Agnostic Shape Fields (RASF)を提案する。
RASFに基づいて,様々な3次元形状表現(点雲,メッシュ,ボクセル)の形状埋め込みを座標インデックスにより検索する。
一度訓練すると、RASFは無視できるコストで、プラグアンドプレイのパフォーマンス向上剤となる。
論文 参考訳(メタデータ) (2022-03-19T06:54:45Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。