論文の概要: CT Film Recovery via Disentangling Geometric Deformation and
Illumination Variation: Simulated Datasets and Deep Models
- arxiv url: http://arxiv.org/abs/2012.09491v1
- Date: Thu, 17 Dec 2020 10:32:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:26:02.104400
- Title: CT Film Recovery via Disentangling Geometric Deformation and
Illumination Variation: Simulated Datasets and Deep Models
- Title(参考訳): 幾何学的変形と照度変化によるCTフィルムの復元:シミュレーションデータセットと深部モデル
- Authors: Quan Quan, Qiyuan Wang, Liu Li, Yuanqi Du, S. Kevin Zhou
- Abstract要約: 約20,000枚の画像からなる大型ヘッドCTフィルムデータベースCTFilm20Kを構築します。
我々は,CTフィルムから抽出した多重マップを用いて,幾何学的変形と照明変化をアンタングル化する枠組みを提案する。
- 参考スコア(独自算出の注目度): 10.9537610290028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While medical images such as computed tomography (CT) are stored in DICOM
format in hospital PACS, it is still quite routine in many countries to print a
film as a transferable medium for the purposes of self-storage and secondary
consultation. Also, with the ubiquitousness of mobile phone cameras, it is
quite common to take pictures of the CT films, which unfortunately suffer from
geometric deformation and illumination variation. In this work, we study the
problem of recovering a CT film, which marks the first attempt in the
literature, to the best of our knowledge. We start with building a large-scale
head CT film database CTFilm20K, consisting of approximately 20,000 pictures,
using the widely used computer graphics software Blender. We also record all
accompanying information related to the geometric deformation (such as 3D
coordinate, depth, normal, and UV maps) and illumination variation (such as
albedo map). Then we propose a deep framework to disentangle geometric
deformation and illumination variation using the multiple maps extracted from
the CT films to collaboratively guide the recovery process. Extensive
experiments on simulated and real images demonstrate the superiority of our
approach over the previous approaches. We plan to open source the simulated
images and deep models for promoting the research on CT film recovery
(https://anonymous.4open.science/r/e6b1f6e3-9b36-423f-a225-55b7d0b55523/).
- Abstract(参考訳): コンピュータ断層撮影(CT)などの医用画像は病院PACSのDICOM形式で保存されているが, セルフストレージや二次コンサルテーションのために, フィルムを転写可能な媒体として印刷することは, 多くの国で日常的に行われている。
また、携帯電話カメラのユビキタス性により、ctフィルムの写真を撮るのが一般的であり、残念ながら幾何学的変形や照明変化に苦しむ。
本研究は,文献における最初の試みであるctフィルムの回収の問題点を,我々の知識を最大限に活用するために検討する。
まず,広く使用されているコンピュータグラフィックスソフトウェアであるBlenderを用いて,約2万枚の画像からなる大規模頭部CTフィルムデータベースCTFilm20Kを構築した。
また,幾何学的変形(3次元座標,深さ,正規分布,紫外線図など)と照明変化(アルベド写像など)に関する全ての情報を記録した。
そこで本研究では,ctフィルムから抽出した多重地図を用いて,幾何変形と照明変動を解消する深い枠組みを提案する。
シミュレーションおよび実画像に対する大規模な実験は、従来のアプローチよりもアプローチの優位性を実証している。
我々はCTフィルム回収の研究を促進するためのシミュレーション画像と深部モデルをオープンソース化する(https://anonymous.4open.science/r/e6b1f6e3-9b36-423f-a225-55b7d0b55523/)。
関連論文リスト
- Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography [1.8424705673580284]
我々は3次元医用画像と対応するテキストレポートとをマッチングする最初のデータセットであるCT-RATEを紹介する。
我々はCTに焦点を当てたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。
我々は3次元胸部CTボリュームのための視覚言語基礎チャットモデルであるCT-CHATを作成する。
論文 参考訳(メタデータ) (2024-03-26T16:19:56Z) - Multi-View Vertebra Localization and Identification from CT Images [57.56509107412658]
我々は,CT画像からの多視点椎体局在と同定を提案する。
本研究では,3次元問題を異なる視点における2次元局所化および識別タスクに変換する。
本手法は,多視点グローバル情報を自然に学習することができる。
論文 参考訳(メタデータ) (2023-07-24T14:43:07Z) - Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。
従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。
これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。
本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:38:42Z) - State of the Art in Dense Monocular Non-Rigid 3D Reconstruction [100.9586977875698]
モノクル2D画像から変形可能なシーン(または非剛体)の3D再構成は、コンピュータビジョンとグラフィックスの長年、活発に研究されてきた領域である。
本研究は,モノクラー映像やモノクラービューの集合から,様々な変形可能な物体や複合シーンを高密度に非剛性で再現するための最先端の手法に焦点を当てる。
論文 参考訳(メタデータ) (2022-10-27T17:59:53Z) - Masked Sinogram Model with Transformer for ill-Posed Computed Tomography
Reconstruction: a Preliminary Study [0.9023847175654602]
自然言語処理におけるトランスフォーマーの成功に触発されて,この研究の中心となる考え方は,トモグラフィーの投影を単語トークンとして考えることである。
我々は、CT再構成を含む下流の様々なアプリケーションに対して、マスク付きシノグラムモデル(MSM)とファインチューンMSMをトレーニングすることで、基礎モデルのアイデアを探求する。
論文 参考訳(メタデータ) (2022-09-03T08:00:04Z) - Recovering medical images from CT film photos [20.57188970071559]
我々は,広く使用されているコンピュータグラフィックスソフトウェアであるBlenderを用いて,約20,000枚の画像からなる大規模頭部CTフィルムデータベースCTFilm20Kを構築した。
textbfFilm textbfImage textbfRecovery textbfNetwork という深層フレームワークを提案する。
本研究では,デワープ画像からDICOMファイルへの変換をカスケードモデルで行うことにより,ラジオミクスの特徴抽出などのさらなる解析を行う。
論文 参考訳(メタデータ) (2022-03-10T03:36:17Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z) - Consistent Video Depth Estimation [57.712779457632024]
モノクロ映像中の全画素に対して, 密度, 幾何的に整合した深度を再構成するアルゴリズムを提案する。
動画中の画素の幾何的制約を確立するために、従来の動きから再構成した構造を利用する。
我々のアルゴリズムは、手持ちの映像をある程度のダイナミックな動きで処理することができる。
論文 参考訳(メタデータ) (2020-04-30T17:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。