論文の概要: Projective Transformation Rectification for Camera-captured Chest X-ray
Photograph Interpretation with Synthetic Data
- arxiv url: http://arxiv.org/abs/2210.05954v1
- Date: Wed, 12 Oct 2022 06:38:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 12:15:26.855265
- Title: Projective Transformation Rectification for Camera-captured Chest X-ray
Photograph Interpretation with Synthetic Data
- Title(参考訳): 合成データを用いた胸部X線写真解釈のための射影変換
- Authors: Chak Fong Chong, Yapeng Wang, Benjamin Ng, Xu Yang
- Abstract要約: 本稿では,この歪みを自動的に修正する,革新的な深層学習型射影変換整流ネットワーク(PTRN)を提案する。
PTRNは、高価な天然データの収集を避けるために、合成データに基づいて訓練されている。
スタンフォード大学機械学習グループ(Stanford University Machine Learning Group)が公開したCheXphoto CXR写真解釈コンペティションにおいて,本手法は大幅な性能向上を実現している。
- 参考スコア(独自算出の注目度): 5.623191768521089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic interpretation on smartphone-captured chest X-ray (CXR) photographs
is challenging due to the geometric distortion (projective transformation)
caused by the non-ideal camera position. In this paper, we proposed an
innovative deep learning-based Projective Transformation Rectification Network
(PTRN) to automatically rectify such distortions by predicting the projective
transformation matrix. PTRN is trained on synthetic data to avoid the expensive
collection of natural data. Therefore, we proposed an innovative synthetic data
framework that accounts for the visual attributes of natural photographs
including screen, background, illuminations, and visual artifacts, and generate
synthetic CXR photographs and projective transformation matrices as the
ground-truth labels for training PTRN. Finally, smartphone-captured CXR
photographs are automatically rectified by trained PTRN and interpreted by a
classifier trained on high-quality digital CXRs to produce final interpretation
results. In the CheXphoto CXR photograph interpretation competition released by
the Stanford University Machine Learning Group, our approach achieves a huge
performance improvement and won first place (ours 0.850, second-best 0.762, in
AUC). A deeper analysis demonstrates that the use of PTRN successfully achieves
the performance on CXR photographs to the same level as on digital CXRs,
indicating PTRN can eliminate all negative impacts of projective transformation
to the interpretation performance. Additionally, there are many real-world
scenarios where distorted photographs have to be used for image classification,
our PTRN can be used to solve those similar problems due to its generality
design.
- Abstract(参考訳): スマートフォンで撮影する胸部X線写真の自動解釈は,非理想カメラ位置による幾何学的歪み(投影変換)により困難である。
本稿では,このような歪みを投影変換行列の予測により自動的に修正する,革新的な深層学習型射影変換整流ネットワーク(ptrn)を提案する。
PTRNは、高価な天然データの収集を避けるために、合成データに基づいて訓練されている。
そこで本研究では,画面,背景,照明,視覚アーティファクトなどの自然写真の視覚特性を考慮し,ptrnを訓練するための接地ラベルとして合成cxr写真および投影変換行列を生成する,革新的な合成データフレームワークを提案する。
最後に,スマートフォンで撮影したCXR画像はPTRNで自動的に修正され,高品質のデジタルCXRで訓練された分類器で解釈され,最終的な解釈結果が得られる。
スタンフォード大学機械学習グループによってリリースされたchexphoto cxr写真解釈コンペティションにおいて、我々のアプローチは大きなパフォーマンス向上を達成し、第1位を獲得した(aucでは0.850、第2位 0.762)。
より深い分析により、PTRNはデジタルCXRと同等レベルのCXR写真の性能を達成できることが示され、PTRNは解釈性能に対する射影変換のすべての負の影響を排除できることを示した。
さらに、画像分類に歪んだ写真を使わなければならない実世界のシナリオは数多くあり、PTRNは、その一般性設計による類似の問題を解決するために使用できる。
関連論文リスト
- X-Transfer: A Transfer Learning-Based Framework for GAN-Generated Fake
Image Detection [33.31312811230408]
顔置換などの偽画像を生成するためにGANを誤用することは、重大なセキュリティ上の懸念を引き起こす。
本稿では,新しい画像検出アルゴリズムであるX-Transferを提案する。
インターリーブされた並列勾配伝送を利用する2つのニューラルネットワークを利用することで、トランスファーラーニングを強化する。
論文 参考訳(メタデータ) (2023-10-07T01:23:49Z) - Physics-Driven Turbulence Image Restoration with Stochastic Refinement [80.79900297089176]
大気乱流による画像歪みは、長距離光学画像システムにおいて重要な問題である。
ディープラーニングモデルが現実世界の乱流条件に適応するために、高速で物理学的なシミュレーションツールが導入された。
本稿では,物理統合復元ネットワーク(PiRN)を提案する。
論文 参考訳(メタデータ) (2023-07-20T05:49:21Z) - Creating Realistic Anterior Segment Optical Coherence Tomography Images
using Generative Adversarial Networks [0.0]
Generative Adversarial Network (GAN) は、高解像度でリアルな前部セグメント光コヒーレンス・トモグラフィ(AS-OCT)画像の作成を目的としている。
我々は,142,628 AS- OCT Bスキャンを用いて,スタイルとウェーブレットをベースとしたGANを訓練した。
論文 参考訳(メタデータ) (2023-06-24T20:48:00Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - VMRF: View Matching Neural Radiance Fields [57.93631771072756]
VMRFは、カメラポーズやカメラポーズの分布に関する事前知識を必要とせずに、効果的なNeRFトレーニングを可能にする、革新的な視野マッチングNeRFである。
VMRFは、不均衡な最適輸送を利用するビューマッチングスキームを導入し、レンダリングされた画像をランダムにカメラのポーズで対応する実画像にマッピングする特徴輸送計画を生成する。
特徴伝達プランをガイダンスとして、レンダリング画像と実画像の相対的なポーズを予測することにより、初期ランダム化されたカメラポーズを補正する新しいポーズキャリブレーション手法を設計する。
論文 参考訳(メタデータ) (2022-07-06T12:26:40Z) - Advantage of Machine Learning over Maximum Likelihood in Limited-Angle
Low-Photon X-Ray Tomography [0.0]
再建過程における事前分布を決定・適用するために,深層ニューラルネットワークを導入する。
私たちのニューラルネットワークは、合成トレーニングサンプルから直接、事前を学習します。
プロジェクション角と光子予算が限られている場合, 深部生成モデルによる先行モデルにより, IC再建の精度が劇的に向上することが実証された。
論文 参考訳(メタデータ) (2021-11-15T16:24:12Z) - On the impact of using X-ray energy response imagery for object
detection via Convolutional Neural Networks [17.639472693362926]
我々は,X線エネルギー応答(高,低)と有効Zの影響について,測地値と比較して検討した。
我々は、CNNアーキテクチャを評価し、そのような「Raw」変種画像で訓練されたモデルの転送可能性について検討する。
論文 参考訳(メタデータ) (2021-08-27T21:28:28Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - Joint Generative Learning and Super-Resolution For Real-World
Camera-Screen Degradation [6.14297871633911]
現実世界の単一画像超解像(SISR)タスクでは、低解像度画像はより複雑な劣化に苦しむ。
本稿では,カメラ画面の劣化に着目し,実世界のデータセット(Cam-ScreenSR)を構築する。
まず、ダウンサンプリング劣化GAN(DD-GAN)をトレーニングし、その分解をモデル化し、より多様なLR画像を生成する。
そして、二重残差チャネルアテンションネットワーク(DuRCAN)がSR画像の復元を学習する。
論文 参考訳(メタデータ) (2020-08-01T07:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。