論文の概要: The Texture-Shape Dilemma: Boundary-Safe Synthetic Generation for 3D Medical Transformers
- arxiv url: http://arxiv.org/abs/2603.00985v1
- Date: Sun, 01 Mar 2026 08:27:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.445769
- Title: The Texture-Shape Dilemma: Boundary-Safe Synthetic Generation for 3D Medical Transformers
- Title(参考訳): テクスチャ形状ジレンマ:3次元医用トランスのバウンダリセーフな合成生成
- Authors: Jiaqi Tang, Weixuan Xu, Shu Zhang, Fandong Zhang, Qingchao Chen,
- Abstract要約: ViTは医療画像分析に革命をもたらしたが、そのデータ不足の性質は、臨床アーカイブの不足とプライバシーの制約と衝突している。
フォーミュラ駆動型スーパービジョンラーニングは、このボトルネックに対する有望な解決策として現れ、実際の患者データを活用することなく、数学的公式から無限の注釈付きサンプルを合成している。
既存のFパラダイムは、均一な強度を持つ単純な幾何学的手法に依存しており、組織テクスチャやCTやMRIのようなモダリティに固有のノイズパターンを無視して、実質的なギャップを生み出している。
本稿では,高頻度合成テクスチャを鼻で添加すると,構造境界の学習に必要な画像勾配信号が劣化し,原因となる臨界衝突境界を同定する。
- 参考スコア(独自算出の注目度): 22.195374577712133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision Transformers (ViTs) have revolutionized medical image analysis, yet their data-hungry nature clashes with the scarcity and privacy constraints of clinical archives. Formula-Driven Supervised Learning (FDSL) has emerged as a promising solution to this bottleneck, synthesizing infinite annotated samples from mathematical formulas without utilizing real patient data. However, existing FDSL paradigms rely on simple geometric shapes with homogeneous intensities, creating a substantial gap by neglecting tissue textures and noise patterns inherent in modalities like CT and MRI. In this paper, we identify a critical optimization conflict termed boundary aliasing: when high-frequency synthetic textures are naively added, they corrupt the image gradient signals necessary for learning structural boundaries, causing the model to fail in delineating real anatomical margins. To bridge this gap, we propose a novel Physics-inspired Spatially-Decoupled Synthesis framework. Our approach orthogonalizes the synthesis process: it first constructs a gradient-shielded buffer zone based on boundary distance to ensure stable shape learning, and subsequently injects physics-driven spectral textures into the object core. This design effectively reconciles robust shape representation learning with invariance to acquisition noise. Extensive experiments on the BTCV and MSD datasets demonstrate that our method significantly outperforms previous FDSL, as well as SSL methods trained on real-world medical datasets, by 1.43% on BTCV and up to 1.51% on MSD task, offering a scalable, annotation-free foundation for medical ViTs. The code will be made publicly available upon acceptance.
- Abstract(参考訳): ヴィジュアルトランスフォーマー(ViT)は、医療画像解析に革命をもたらしたが、そのデータに飢えた性質は、臨床アーカイブの不足とプライバシーの制約と衝突している。
フォーミュラ駆動型スーパービジョンラーニング(FDSL)はこのボトルネックに対する有望な解決策として現れ、実際の患者データを活用することなく、数学的公式から無限の注釈付きサンプルを合成している。
しかし、既存のFDSLパラダイムは、均質な強度を持つ単純な幾何学的形状に依存しており、組織テクスチャや、CTやMRIのようなモジュラリティに固有のノイズパターンを無視して、実質的なギャップを生み出している。
本稿では, 高頻度合成テクスチャを鼻で添加すると, 構造境界の学習に必要な画像勾配信号が劣化し, 実際の解剖学的マージンの定式化に失敗する。
このギャップを埋めるために,物理に着想を得た空間分離型合成フレームワークを提案する。
提案手法は, 安定な形状学習を実現するため, まず境界距離に基づく勾配シールドバッファゾーンを構築し, その後, 物理駆動のスペクトルテクスチャを物体コアに注入する。
この設計は、取得ノイズに不変な頑健な形状表現学習を効果的に調整する。
BTCVおよびMSDデータセットに対する大規模な実験により、我々の手法は、実際の医療データセットでトレーニングされたSSLメソッドと、BTCVで1.43%、MSDタスクで1.51%、医療用VTでスケーラブルでアノテーションのない基盤を提供することで、従来のFDSLよりも大幅に優れていたことが示されている。
コードは受理時に公開されます。
関連論文リスト
- Fake It Right: Injecting Anatomical Logic into Synthetic Supervised Pre-training for Medical Segmentation [21.75204301463342]
ビジョントランスフォーマー(ViT)は3次元の医療セグメンテーションで優れるが、大量のデータセットを必要とする。
Formula-Driven Supervised Learning (F)は、合成数学的プリミティブを事前学習することで、プライバシ保護の代替手段を提供する。
本稿では,Fの無限拡張性と解剖学的リアリズムを一体化するための注釈付きインフォームド・シンセティック・アナトロジー・プレトレーニング・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-01T08:15:18Z) - Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis [3.3176565054468714]
本稿では、シミュレーションと現実のギャップを埋めることのできる、労働自由化のための新しい枠組みを提案する。
我々は、不対向画像画像変換にCycleGAN(Cycle-Consistent Generative Adversarial Network)を用いる。
この合成データに特化して訓練されたU-Netモデルは、目に見えない実験画像に展開する際、顕著な一般化を示した。
論文 参考訳(メタデータ) (2026-02-02T06:36:06Z) - Interp3D: Correspondence-aware Interpolation for Generative Textured 3D Morphing [63.141976759536625]
テクスチャ化された3DモーフィングのためのトレーニングフリーフレームワークであるInterp3Dを提案する。
生成的先行性を利用し、幾何学的忠実さとテクスチャコヒーレンスの両方を保証するために、プログレッシブアライメント原理を採用する。
包括的評価のために, 難易度の高い専用データセットInterp3DDataを構築し, 忠実度, 遷移滑らか度, 可視性から生成結果を評価する。
論文 参考訳(メタデータ) (2026-01-20T16:03:22Z) - Physically-Grounded Manifold Projection Model for Generalizable Metal Artifact Reduction in Dental CBCT [20.637726557566793]
歯科用CBCTの金属遺物は極めて不明瞭な解剖学的構造である。
現在のMAR(Metal Artifact Reduction)の深層学習は制限に直面している。
Denoising Diffusion Models (DDPM) はリアリズムを提供するが、遅い反復的なサンプリングに依存している。
論文 参考訳(メタデータ) (2025-12-30T14:36:26Z) - Denoising via Repainting: an image denoising method using layer wise medical image repainting [6.195127726026568]
異方性ガウスフィルタとプログレッシブベジエパス再描画を統合したマルチスケール手法を提案する。
本手法は, 構造的詳細を保存しながら, 騒音を緩和するスケールスペースピラミッドを構築する。
複数のMRIデータセットに対する実験結果は、競合する手法よりもPSNRとSSIMが一貫した改善を示した。
論文 参考訳(メタデータ) (2025-03-11T06:54:37Z) - PhyRecon: Physically Plausible Neural Scene Reconstruction [81.73129450090684]
PHYRECONは、微分可能なレンダリングと微分可能な物理シミュレーションの両方を利用して暗黙的な表面表現を学習する最初のアプローチである。
この設計の中心は、SDFに基づく暗黙の表現と明示的な表面点の間の効率的な変換である。
また,物理シミュレータの安定性も向上し,全データセットに対して少なくとも40%の改善が得られた。
論文 参考訳(メタデータ) (2024-04-25T15:06:58Z) - Boundary Constraint-free Biomechanical Model-Based Surface Matching for Intraoperative Liver Deformation Correction [0.6249768559720122]
画像ガイド下肝手術において, 3D-3D非剛性登録法は, 点雲として表される術前モデルと術中表面のマッピングを推定する上で重要な役割を担っている。
修正されたFEMを表面マッチング項に組み込んだ3D-3D非剛性登録法を提案する。
論文 参考訳(メタデータ) (2024-03-15T02:05:20Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Diffusion-based Holistic Texture Rectification and Synthesis [26.144666226217062]
伝統的なテクスチャ合成アプローチは、原始サンプルからテクスチャを生成することに重点を置いている。
自然画像中の劣化サンプルから全体的テクスチャを合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-26T08:44:46Z) - InsMix: Towards Realistic Generative Data Augmentation for Nuclei
Instance Segmentation [29.78647170035808]
本稿では,コピック・ペースト・スムース原理に従って,核セグメンテーションのための現実的なデータ拡張手法InsMixを提案する。
具体的には、拡張画像が原子核に関する豪華な情報を取得することができる形態的制約を提案する。
背景の画素冗長性をフル活用するために,背景パッチをランダムにシャッフルする背景摂動法を提案する。
論文 参考訳(メタデータ) (2022-06-30T08:58:05Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z) - NeRF in detail: Learning to sample for view synthesis [104.75126790300735]
ニューラルレイディアンス場(NeRF)法は目覚ましい新しいビュー合成を実証している。
この作業では、バニラ粗大なアプローチの明確な制限に対処します -- パフォーマンスに基づいており、手元にあるタスクのエンドツーエンドをトレーニングしていません。
我々は、サンプルの提案と、そのネットワークにおける重要性を学習し、そのニューラルネットワークアーキテクチャに対する複数の代替案を検討し比較する、微分可能なモジュールを導入する。
論文 参考訳(メタデータ) (2021-06-09T17:59:10Z) - Data-driven generation of plausible tissue geometries for realistic
photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。
我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。
我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文 参考訳(メタデータ) (2021-03-29T11:30:18Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。