論文の概要: BDIS: Bayesian Dense Inverse Searching Method for Real-Time Stereo
Surgical Image Matching
- arxiv url: http://arxiv.org/abs/2205.03133v1
- Date: Fri, 6 May 2022 10:50:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 17:32:54.818298
- Title: BDIS: Bayesian Dense Inverse Searching Method for Real-Time Stereo
Surgical Image Matching
- Title(参考訳): bdis:リアルタイムステレオ手術画像マッチングのためのベイズ密度逆探索法
- Authors: Jingwei Song, Qiuchen Zhu, Jianyu Lin and Maani Ghaffari
- Abstract要約: 本稿では,一般的なMISタスクに対して,CPUレベルの事前自由ステレオマッチングアルゴリズムを提案する。
手術画像用のシングルコアCPU (i5-9400) を用いて, 640*480の画像に対して平均17Hzを実現する。
MIS のベースライン ELAS よりも近いか高い精度で出力が小さいが、4-5倍高速である。
- 参考スコア(独自算出の注目度): 2.990820994368054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In stereoscope-based Minimally Invasive Surgeries (MIS), dense stereo
matching plays an indispensable role in 3D shape recovery, AR, VR, and
navigation tasks. Although numerous Deep Neural Network (DNN) approaches are
proposed, the conventional prior-free approaches are still popular in the
industry because of the lack of open-source annotated data set and the
limitation of the task-specific pre-trained DNNs. Among the prior-free stereo
matching algorithms, there is no successful real-time algorithm in none GPU
environment for MIS. This paper proposes the first CPU-level real-time
prior-free stereo matching algorithm for general MIS tasks. We achieve an
average 17 Hz on 640*480 images with a single-core CPU (i5-9400) for surgical
images. Meanwhile, it achieves slightly better accuracy than the popular ELAS.
The patch-based fast disparity searching algorithm is adopted for the rectified
stereo images. A coarse-to-fine Bayesian probability and a spatial Gaussian
mixed model were proposed to evaluate the patch probability at different
scales. An optional probability density function estimation algorithm was
adopted to quantify the prediction variance. Extensive experiments demonstrated
the proposed method's capability to handle ambiguities introduced by the
textureless surfaces and the photometric inconsistency from the non-Lambertian
reflectance and dark illumination. The estimated probability managed to balance
the confidences of the patches for stereo images at different scales. It has
similar or higher accuracy and fewer outliers than the baseline ELAS in MIS,
while it is 4-5 times faster. The code and the synthetic data sets are
available at https://github.com/JingweiSong/BDIS-v2.
- Abstract(参考訳): ステレオスコープベースのMinimally Invasive Surgeries (MIS)では、3D形状回復、AR、VR、ナビゲーションタスクにおいて、密集したステレオマッチングが不可欠である。
多数のDeep Neural Network (DNN) アプローチが提案されているが、オープンソースの注釈付きデータセットの欠如とタスク固有の事前訓練DNNの制限のため、従来の事前自由なアプローチは依然として業界で人気がある。
事前フリーのステレオマッチングアルゴリズムのうち、misのgpu環境にはないリアルタイムアルゴリズムは成功していない。
本稿では,一般的なMISタスクに対して,CPUレベルの事前自由ステレオマッチングアルゴリズムを提案する。
手術用cpu (i5-9400) を搭載した640*480画像では, 平均17hzであった。
一方、一般的なELASよりも若干精度が良い。
補正ステレオ画像にはパッチベース高速不一致探索アルゴリズムが採用されている。
異なるスケールでパッチ確率を評価するために,粗大なベイズ確率と空間ガウス混合モデルを提案した。
予測分散を定量化するために,任意の確率密度関数推定アルゴリズムを採用した。
広汎な実験により、非ランベルト反射率と暗照度からのテクスチャーレス表面の曖昧さと測光的不整合に対処する手法が実証された。
推定確率は、異なるスケールでステレオ画像に対するパッチの信頼性のバランスをとることができた。
MIS のベースライン ELAS よりも近いか高い精度で出力が小さいが、4-5倍高速である。
コードと合成データセットはhttps://github.com/JingweiSong/BDIS-v2で公開されている。
関連論文リスト
- Generalization of pixel-wise phase estimation by CNN and improvement of
phase-unwrapping by MRF optimization for one-shot 3D scan [0.621405559652172]
シングルパターンプロジェクション(ワンショット3Dスキャン)を用いたアクティブステレオ技術は、産業や医療目的などから広く注目を集めている。
ワンショット3Dスキャンの深刻な欠点はスパース再構成である。
パターンが正規かつ周期的であれば,任意のタイプの静的パターンに適用可能なワンショットスキャンのための画素ワイズ手法を提案する。
論文 参考訳(メタデータ) (2023-09-26T10:45:04Z) - Curvature regularization for Non-line-of-sight Imaging from
Under-sampled Data [5.591221518341613]
非視線イメージング(NLOS)は、視線で測定されたデータから3次元の隠れたシーンを再構築することを目的としている。
曲率正規化に基づく新しいNLOS再構成モデルを提案する。
提案したアルゴリズムを,合成データセットと実データセットの両方で評価する。
論文 参考訳(メタデータ) (2023-01-01T14:10:43Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Robust and accurate depth estimation by fusing LiDAR and Stereo [8.85338187686374]
本稿では,LiDARとステレオカメラを融合させる高精度でロバストな手法を提案する。
この方法は、LiDARとステレオカメラの利点を完全に組み合わせている。
提案したパイプラインをKITTIベンチマークで評価した。
論文 参考訳(メタデータ) (2022-07-13T11:55:15Z) - SiPRNet: End-to-End Learning for Single-Shot Phase Retrieval [8.820823270160695]
畳み込みニューラルネットワーク(CNN)は、様々な画像再構成タスクにおいて重要な役割を果たしている。
本稿では,1つのフーリエ強度測定から信号を取得するために,SiPRNetという新しいCNN構造を設計する。
提案手法は、シングルショットマスクレス位相検索において、他のCNNおよび従来の最適化手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2022-05-23T16:24:52Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Unsupervised Single Image Super-resolution Under Complex Noise [60.566471567837574]
本稿では,一般のSISRタスクを未知の劣化で扱うためのモデルベースunsupervised SISR法を提案する。
提案手法は, より小さなモデル (0.34M vs. 2.40M) だけでなく, より高速な技術 (SotA) 法 (約1dB PSNR) の現況を明らかに超えることができる。
論文 参考訳(メタデータ) (2021-07-02T11:55:40Z) - Bayesian dense inverse searching algorithm for real-time stereo matching
in minimally invasive surgery [1.2074552857379273]
手術画像のCPUレベルリアルタイムステレオマッチング法について報告する(i5-9400の単一コアを持つ640×480画像の10Hz)。
提案手法は,ステレオ画像の差分を推定する高速な'dense inverse search'アルゴリズムに基づいて構築される。
実験の結果, 手術シナリオにおいて, 推定深度は基準法よりも精度が高く, アウトリーチも少ないことが明らかとなった。
論文 参考訳(メタデータ) (2021-06-14T02:26:27Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z) - Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance
Disparity Estimation [51.17232267143098]
ステレオ画像から3次元物体を検出するための新しいシステムDisp R-CNNを提案する。
我々は、LiDAR点雲を必要とせずに、統計的形状モデルを用いて、密度の異なる擬似地下構造を生成する。
KITTIデータセットの実験によると、LiDARの基盤構造がトレーニング時に利用できない場合でも、Disp R-CNNは競争性能を達成し、平均精度で従来の最先端手法を20%上回っている。
論文 参考訳(メタデータ) (2020-04-07T17:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。