論文の概要: SV-DRR: High-Fidelity Novel View X-Ray Synthesis Using Diffusion Model
- arxiv url: http://arxiv.org/abs/2507.05148v1
- Date: Mon, 07 Jul 2025 15:58:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.501039
- Title: SV-DRR: High-Fidelity Novel View X-Ray Synthesis Using Diffusion Model
- Title(参考訳): SV-DRR:拡散モデルを用いた高忠実新鮮X線合成
- Authors: Chun Xie, Yuichi Yoshii, Itaru Kitahara,
- Abstract要約: 単一視点からのマルチビューX線画像に対する新しいビュー条件付きモデルを提案する。
提案手法ではディフュージョン変換器を用いて細部を保存し,高解像度画像の安定生成に弱いストロングトレーニング戦略を用いる。
実験結果から,視角制御を改良した高分解能出力が得られた。
- 参考スコア(独自算出の注目度): 0.8670827427401335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: X-ray imaging is a rapid and cost-effective tool for visualizing internal human anatomy. While multi-view X-ray imaging provides complementary information that enhances diagnosis, intervention, and education, acquiring images from multiple angles increases radiation exposure and complicates clinical workflows. To address these challenges, we propose a novel view-conditioned diffusion model for synthesizing multi-view X-ray images from a single view. Unlike prior methods, which are limited in angular range, resolution, and image quality, our approach leverages the Diffusion Transformer to preserve fine details and employs a weak-to-strong training strategy for stable high-resolution image generation. Experimental results demonstrate that our method generates higher-resolution outputs with improved control over viewing angles. This capability has significant implications not only for clinical applications but also for medical education and data extension, enabling the creation of diverse, high-quality datasets for training and analysis. Our code is available at GitHub.
- Abstract(参考訳): X線イメージングは、ヒトの内部解剖を可視化するための迅速で費用対効果の高いツールである。
マルチビューX線イメージングは、診断、介入、教育を強化する補完的な情報を提供するが、複数の角度から画像を取得することで放射線曝露が増加し、臨床ワークフローが複雑化する。
これらの課題に対処するために,一視点から多視点X線画像を合成するビュー条件拡散モデルを提案する。
角度範囲,解像度,画質に制限のある従来の手法とは異なり,Diffusion Transformerを用いて細部を保存し,高解像度画像生成のための弱い訓練戦略を採用する。
実験結果から,視角制御を改良した高分解能出力が得られた。
この能力は、臨床応用だけでなく、医学教育やデータ拡張にも重要な意味を持ち、訓練と分析のための多種多様な高品質データセットの作成を可能にしている。
私たちのコードはGitHubで入手可能です。
関連論文リスト
- PixCell: A generative foundation model for digital histopathology images [49.00921097924924]
PixCellは,病理組織学における最初の拡散ベース生成基盤モデルである。
われわれはPanCan-30MでPixCellをトレーニングした。
論文 参考訳(メタデータ) (2025-06-05T15:14:32Z) - Novel-view X-ray Projection Synthesis through Geometry-Integrated Deep Learning [3.4916237834391874]
DL-GIPSモデルは1つの既存の投影を利用して新しい視点からX線投影を合成する。
このモデルは、初期投影から抽出した幾何学的特徴とテクスチャ的特徴を戦略的に操り、新しい視角に合わせる。
そして、改良された幾何学的特徴と一貫したテクスチャ情報とを融合して、高度な画像生成プロセスを通じて最終的な投影を合成する。
論文 参考訳(メタデータ) (2025-04-16T10:30:08Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - MLVICX: Multi-Level Variance-Covariance Exploration for Chest X-ray Self-Supervised Representation Learning [6.4136876268620115]
MLVICXは、胸部X線画像からの埋め込みの形でリッチな表現をキャプチャするアプローチである。
自己教師付き胸部X線表現学習におけるMLVICXの性能を示す。
論文 参考訳(メタデータ) (2024-03-18T06:19:37Z) - MVC: A Multi-Task Vision Transformer Network for COVID-19 Diagnosis from
Chest X-ray Images [10.616065108433798]
本稿では,胸部X線画像を同時に分類し,入力データから影響領域を識別するマルチタスク・ビジョン・トランスフォーマ(MVC)を提案する。
提案手法はVision Transformer上に構築されているが,マルチタスク設定で学習能力を拡張している。
論文 参考訳(メタデータ) (2023-09-30T15:52:18Z) - XVertNet: Unsupervised Contrast Enhancement of Vertebral Structures with Dynamic Self-Tuning Guidance and Multi-Stage Analysis [1.3584858315758948]
胸部X線は救急医療の主要な診断ツールであり続けているが、微細な解剖学的詳細を捉える能力に限界があるため、診断が遅れることがある。
XVertNetは,X線画像における脊椎構造の可視化を著しく向上するために設計された,新しいディープラーニングフレームワークである。
論文 参考訳(メタデータ) (2023-06-06T19:36:11Z) - Fine-tuned Generative Adversarial Network-based Model for Medical Image Super-Resolution [2.647302105102753]
The Real-Enhanced Super-Resolution Generative Adversarial Network (Real-ESRGAN) is a practical model for recovery HR images from real-world LR images。
実世界の画像劣化をシミュレートするReal-ESRGANの高次劣化モデルを用いる。
提案モデルでは,Real-ESRGANモデルに比べて知覚品質が優れ,細部を効果的に保存し,より現実的なテクスチャで画像を生成する。
論文 参考訳(メタデータ) (2022-11-01T16:48:04Z) - Image Synthesis with Disentangled Attributes for Chest X-Ray Nodule
Augmentation and Detection [52.93342510469636]
肺癌早期検診では胸部X線像の肺結節検出が一般的である。
ディープラーニングに基づくコンピュータ支援診断(CAD)システムは、CXRの結節スクリーニングのために放射線科医をサポートすることができる。
このようなデータセットの可用性を損なうため,データ拡張のために肺結節合成法を提案する。
論文 参考訳(メタデータ) (2022-07-19T16:38:48Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。