論文の概要: Cross-attention learning enables real-time nonuniform rotational
distortion correction in OCT
- arxiv url: http://arxiv.org/abs/2306.04512v2
- Date: Fri, 5 Jan 2024 06:51:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-08 18:28:25.670544
- Title: Cross-attention learning enables real-time nonuniform rotational
distortion correction in OCT
- Title(参考訳): OCTにおける非一様回転歪みのリアルタイム補正を可能にするクロスアテンション学習
- Authors: Haoran Zhang, Jianlong Yang, Jingqian Zhang, Shiqing Zhao, Aili Zhang
- Abstract要約: 非一様回転歪み(NURD)補正は内視鏡的光コヒーレンス断層撮影(OCT)に不可欠である。
本稿では,OCTにおけるNURD補正のためのクロスアテンション学習手法を提案する。
本手法は,自然言語処理とコンピュータビジョンにおける自己認識機構の成功に着想を得たものである。
- 参考スコア(独自算出の注目度): 15.445504413810093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nonuniform rotational distortion (NURD) correction is vital for endoscopic
optical coherence tomography (OCT) imaging and its functional extensions, such
as angiography and elastography. Current NURD correction methods require
time-consuming feature tracking or cross-correlation calculations and thus
sacrifice temporal resolution. Here we propose a cross-attention learning
method for the NURD correction in OCT. Our method is inspired by the recent
success of the self-attention mechanism in natural language processing and
computer vision. By leveraging its ability to model long-range dependencies, we
can directly obtain the correlation between OCT A-lines at any distance, thus
accelerating the NURD correction. We develop an end-to-end stacked
cross-attention network and design three types of optimization constraints. We
compare our method with two traditional feature-based methods and a CNN-based
method, on two publicly-available endoscopic OCT datasets and a private dataset
collected on our home-built endoscopic OCT system. Our method achieved a
$\sim3\times$ speedup to real time ($26\pm 3$ fps), and superior correction
performance.
- Abstract(参考訳): 非一様回転歪み(NURD)補正は、内視鏡的光コヒーレンス断層撮影(OCT)および血管造影やエラストグラフィーなどの機能拡張に不可欠である。
現在のNURD補正法は時間を要する特徴追跡や相互相関計算を必要とし、時間分解能を犠牲にする。
本稿では,OCTにおけるNURD補正のためのクロスアテンション学習手法を提案する。
本手法は,自然言語処理とコンピュータビジョンにおける自己認識機構の成功に着想を得たものである。
長距離依存をモデル化することで、任意の距離でOCT A線間の相関関係を直接得ることができ、NURD補正を高速化することができる。
終端から終端までのマルチアテンションネットワークを開発し、3種類の最適化制約を設計する。
提案手法を従来の2つの特徴ベース手法とCNNベースの手法と比較し, 市販の2つの内視鏡OCTデータセットと, 自家製の内視鏡OCTシステムで収集したプライベートデータセットを比較した。
提案手法は,実時間 (26\pm 3$ fps) に対して$\sim3\times$ speedupを達成し, 補正性能も向上した。
関連論文リスト
- Rotational Augmented Noise2Inverse for Low-dose Computed Tomography
Reconstruction [83.73429628413773]
改良された深層学習手法は、画像のノイズを除去する能力を示しているが、正確な地上の真実を必要とする。
畳み込みニューラルネットワーク(CNN)のトレーニングに基礎的真理を必要としないLDCTのための新しい自己教師型フレームワークを提案する。
数値および実験結果から,Sparse View を用いた N2I の再構成精度は低下しており,提案手法は異なる範囲のサンプリング角度で画像品質を向上する。
論文 参考訳(メタデータ) (2023-12-19T22:40:51Z) - INeAT: Iterative Neural Adaptive Tomography [34.84974955073465]
反復型ニューラルアダプティブ・トモグラフィ(INeAT)は、姿勢の最適化を組み込んで、姿勢の摂動の影響を抑える。
IneAT は, 顕著なポーズ障害を伴うシナリオにおいて, アーティファクト抑制, 解像度向上を達成できることを実証した。
論文 参考訳(メタデータ) (2023-11-03T01:00:36Z) - Towards Head Computed Tomography Image Reconstruction Standardization
with Deep Learning Assisted Automatic Detection [5.288684776927016]
頭部CT像の3次元再構成は組織構造の複雑な空間的関係を解明する。
偏差のない最適な頭部CTスキャンを確保することは、技術者による低い位置決め、患者の身体的制約、CTスキャナの傾斜角度制限など、臨床環境では困難である。
そこで本研究では,手動による介入を低減し,精度と再現性を向上し,効率的な頭部CT画像の3D再構成法を提案する。
論文 参考訳(メタデータ) (2023-07-31T06:58:49Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - Anatomically constrained CT image translation for heterogeneous blood
vessel segmentation [3.88838725116957]
造影CT(ceCT)画像の解剖学的構造は, 造影剤拡散の変動により, 分画が困難になる可能性がある。
放射線線量を制限するために、生成モデルは1つのモダリティを合成するために用いられる。
CycleGANは、ペアデータの必要性を軽減するため、特に注目を集めている。
本稿では,高忠実度画像を生成するためのCycleGANの拡張について述べる。
論文 参考訳(メタデータ) (2022-10-04T16:14:49Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z) - A Spatiotemporal Model for Precise and Efficient Fully-automatic 3D
Motion Correction in OCT [10.550562752812894]
OCT機器は網膜を横断する焦点スポットをバイスキャンし、断面画像を取得してデータを生成する。
非剛性で歪んだ歪みが発生し、データのギャップが生じる。
本稿では,新しい歪みモデルとそれに対応する完全自動参照フリーな計算ロバスト性最適化戦略を提案する。
論文 参考訳(メタデータ) (2022-09-15T11:48:53Z) - Fluid registration between lung CT and stationary chest tomosynthesis
images [23.239722016943794]
計測された投影とデジタル再構成されたラジオグラフに基づいて3次元変形を推定する3D/2D登録手法を定式化する。
我々は,CTと静止胸部トモシンセシス(sDCT)画像の登録に対するアプローチを実証し,それが反復的画像再構成アプローチにどのように自然に導かれるかを示した。
論文 参考訳(メタデータ) (2022-03-06T21:51:49Z) - Incremental Cross-view Mutual Distillation for Self-supervised Medical
CT Synthesis [88.39466012709205]
本稿では,スライス間の分解能を高めるために,新しい医療スライスを構築した。
臨床実践において, 根本・中間医療スライスは常に欠落していることを考慮し, 相互蒸留の段階的相互蒸留戦略を導入する。
提案手法は,最先端のアルゴリズムよりも明確なマージンで優れる。
論文 参考訳(メタデータ) (2021-12-20T03:38:37Z) - 4D Spatio-Temporal Convolutional Networks for Object Position Estimation
in OCT Volumes [69.62333053044712]
3次元畳み込みニューラルネットワーク(CNN)は、単一のOCT画像を用いたマーカーオブジェクトのポーズ推定に有望な性能を示した。
我々は3次元CNNを4次元時間CNNに拡張し、マーカーオブジェクト追跡のための追加の時間情報の影響を評価する。
論文 参考訳(メタデータ) (2020-07-02T12:02:20Z) - Spatio-Temporal Deep Learning Methods for Motion Estimation Using 4D OCT
Image Data [63.73263986460191]
特定の対象領域の局所化と運動の推定は、外科的介入の際のナビゲーションの一般的な問題である。
OCT画像ボリュームの時間的ストリームを用いることで、深層学習に基づく動き推定性能が向上するかどうかを検討する。
モデル入力に4D情報を使用すると、合理的な推論時間を維持しながら性能が向上する。
論文 参考訳(メタデータ) (2020-04-21T15:43:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。