論文の概要: Cranio-Diff: Diffusion-based Cross-domain Craniofacial Reconstruction with 2D X-ray Skull Guidance and Structural Identity Constraints
- arxiv url: http://arxiv.org/abs/2606.09699v1
- Date: Mon, 08 Jun 2026 16:20:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.499602
- Title: Cranio-Diff: Diffusion-based Cross-domain Craniofacial Reconstruction with 2D X-ray Skull Guidance and Structural Identity Constraints
- Title(参考訳): Cranio-Diff:2次元X線スカル誘導と構造的アイデンティティ制約を用いた拡散型クロスドメイン頭蓋顔面再建術
- Authors: Ravi Shankar Prasad, Naresh Gurjar, Shashank Baghel, Chirag, Dinesh Singh,
- Abstract要約: 本稿では,2次元X線頭蓋骨画像から顎顔面領域を再構築するための拡散型フレームワークであるCranio-Diffを提案する。
提案手法は, 頭蓋骨に意味的かつ構造的に整合した顔を生成するために, ControlNetによる頭蓋骨条件付き構造ガイダンスとバイオメトリックテキストコンディショニングを統合した。
- 参考スコア(独自算出の注目度): 2.282352855717941
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The state-of-the-art generative models, such as CycleGAN, Pix2Pix, and diffusion models have demonstrated remarkable performance in the face generation task. However, they fail to effectively capture cross-modality semantic information in craniofacial reconstruction when translating from the skull (x-ray) to the face (optical) domain, due to a mismatch in the alignment of structural identity across modalities. To address this issue, we propose Cranio-Diff, a diffusion-based framework for cross-domain cranio-facial reconstruction from 2D X-ray skull images. The proposed approach integrates skull-conditioned structural guidance through ControlNet with biometric text conditioning to generate a face which is more semantically and structurally aligned with the given skull. The proposed Cranio-diff method is evaluated on skull-face dataset obtained from X-ray scans of 120 subjects in lateral and frontal views. To enable controlled evaluation, each face image is synthesised across three age groups (25, 45, 65) and three BMI variations of -10%, baseline and +10%, yielding 4320 paired samples. To the best of our knowledge, this is the only X-ray-face dataset with this magnitude. Extensive experiments showed that the proposed method outperforms recent existing approaches in both generated image quality and retrieval task. Finally, to evaluate the performance of our proposed method, we have evaluated the quality of the generated image using FID, IS, SSIM, LPIPS, PSNR and ArcFace score. Additionally, retrieval performance is evaluated using recall@k, mAP@k and MRR@k. Obtained experimental results demonstrate that the proposed method can be used as an alternate tool in providing aid in forensic investigations.
- Abstract(参考訳): CycleGAN、Pix2Pix、拡散モデルといった最先端の生成モデルは、顔生成タスクにおいて顕著な性能を示した。
しかし、頭蓋骨(x線)から顔(光学)領域への翻訳において、モダリティ間での構造的アイデンティティの整合性のミスマッチが原因で、頭蓋顔面再建におけるモダリティ間の意味情報を効果的に捉えられなかった。
この問題を解決するために,2次元X線頭蓋骨画像からのクロスドメイン頭蓋顔面再建のための拡散基盤フレームワークであるCranio-Diffを提案する。
提案手法は, 頭蓋骨とより意味的に, 構造的に整合した顔を生成するために, ControlNetによる頭蓋骨条件付き構造ガイダンスとバイオメトリックテキストコンディショニングを統合した。
Cranio-diff法は,120人の被験者の側方および前頭側からのX線スキャンから得られた頭蓋顔面のデータセットを用いて評価した。
制御された評価を可能にするために、各顔画像は3つの年齢群(25, 45, 65)と3つのBMI変種(-10%, baseline, +10%)で合成され、4320対のサンプルが得られる。
私たちの知る限りでは、この大きさを持つ唯一のX線面データセットである。
大規模な実験により,提案手法は画像品質と検索タスクの両方において,近年の既存手法よりも優れていた。
最後に,提案手法の性能を評価するため,FID,IS,SSIM,LPIPS,PSNR,ArcFaceスコアを用いて生成画像の品質評価を行った。
さらに、リコール@k、mAP@k、MRR@kを用いて検索性能を評価する。
得られた実験結果から, 提案手法は, 法医学的な調査を支援するための代替手段として利用できることが示された。
関連論文リスト
- Cranio-ID: Graph-Based Craniofacial Identification via Automatic Landmark Annotation in 2D Multi-View X-rays [2.4382430407654767]
伝統的な頭蓋骨測位法は時間を要するものであり、専門的な知識と専門知識を必要とする。
まず,光学画像を用いた2次元頭蓋骨のランドマークの自動アノテーションであるCranio-IDを提案する。
第二に、これらのランドマークをグラフ表現に定式化し、これらの2つのモダリティのグラフ間の意味的対応を見つけることによって、クロスモーダルマッチングを行う。
論文 参考訳(メタデータ) (2025-11-18T12:15:22Z) - FCR: Investigating Generative AI models for Forensic Craniofacial Reconstruction [2.9936254916060503]
2次元X線画像からの頭蓋顔面再建のための汎用的枠組みを提案する。
2次元X線が頭蓋顔面再建のための生成モデルによって頭蓋骨の表現として使用されるのは、これが初めてである。
実験結果から,これは法医学の有効なツールであることがわかった。
論文 参考訳(メタデータ) (2025-08-25T13:52:59Z) - Cross-Domain Identity Representation for Skull to Face Matching with Benchmark DataSet [6.1655282360871375]
本稿では,頭蓋骨のX線像が与えられた人物の識別のための枠組みについて,畳み込みシームズネットワークを用いたクロスドメイン識別のための枠組みを提案する。
シームズネットワークは、同じアーキテクチャを共有するツインネットワークであり、近くの観測がグループ化され、異なる観測が分離される特徴空間を発見するために訓練することができる。
論文 参考訳(メタデータ) (2025-07-11T05:49:12Z) - A Two-Stage Generative Model with CycleGAN and Joint Diffusion for
MRI-based Brain Tumor Detection [41.454028276986946]
本稿では,脳腫瘍の検出とセグメンテーションを改善するための2段階生成モデル(TSGM)を提案する。
CycleGANは、未ペアデータに基づいてトレーニングされ、データとして正常な画像から異常な画像を生成する。
VE-JPは、合成対の異常画像をガイドとして使用して、健康な画像の再構成を行う。
論文 参考訳(メタデータ) (2023-11-06T12:58:26Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - Revisiting Computer-Aided Tuberculosis Diagnosis [56.80999479735375]
結核(TB)は世界的な健康上の脅威であり、毎年何百万人もの死者を出している。
深層学習を用いたコンピュータ支援結核診断 (CTD) は有望であるが, 限られたトレーニングデータによって進行が妨げられている。
結核X線(TBX11K)データセットは11,200個の胸部X線(CXR)画像とそれに対応するTB領域のバウンディングボックスアノテーションを含む。
このデータセットは、高品質なCTDのための洗練された検出器のトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-06T08:27:48Z) - Patched Diffusion Models for Unsupervised Anomaly Detection in Brain MRI [55.78588835407174]
本稿では,正常脳解剖のパッチベース推定法として拡散モデルの生成タスクを再構築する手法を提案する。
腫瘍と多発性硬化症について検討し,既存のベースラインと比較して25.1%の改善がみられた。
論文 参考訳(メタデータ) (2023-03-07T09:40:22Z) - Orientation-Shared Convolution Representation for CT Metal Artifact
Learning [63.67718355820655]
X線CT(CT)スキャン中、患者を乗せた金属インプラントは、しばしば有害なアーティファクトに繋がる。
既存のディープラーニングベースの手法は、有望な再構築性能を得た。
本稿では,人工物の物理的事前構造に適応するために,配向型畳み込み表現戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T13:56:12Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z) - Scale-Space Autoencoders for Unsupervised Anomaly Segmentation in Brain
MRI [47.26574993639482]
本研究では, 異常セグメンテーション性能の向上と, ネイティブ解像度で入力データのより鮮明な再構成を行う汎用能力を示す。
ラプラシアンピラミッドのモデリングにより、複数のスケールで病変のデライン化と集約が可能になる。
論文 参考訳(メタデータ) (2020-06-23T09:20:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。