論文の概要: Bimodal Camera Pose Prediction for Endoscopy
- arxiv url: http://arxiv.org/abs/2204.04968v1
- Date: Mon, 11 Apr 2022 09:34:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 02:14:18.922457
- Title: Bimodal Camera Pose Prediction for Endoscopy
- Title(参考訳): 内視鏡用バイモーダルカメラポース予測
- Authors: Anita Rau, Binod Bhattarai, Lourdes Agapito, Danail Stoyanov
- Abstract要約: 大腸内視鏡におけるカメラポーズ推定のための合成データセットSimColを提案する。
我々のデータセットは実際の大腸内視鏡の動きを再現し、既存の方法の欠点を強調します。
シミュレーション大腸内視鏡による18kのRGB画像とそれに対応する深度とカメラのポーズを公開し,Unityのデータ生成環境を一般公開した。
- 参考スコア(独自算出の注目度): 23.98082486621098
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deducing the 3D structure of endoscopic scenes from images remains extremely
challenging. In addition to deformation and view-dependent lighting, tubular
structures like the colon present problems stemming from the self-occluding,
repetitive anatomical structures. In this paper, we propose SimCol, a synthetic
dataset for camera pose estimation in colonoscopy and a novel method that
explicitly learns a bimodal distribution to predict the endoscope pose. Our
dataset replicates real colonoscope motion and highlights drawbacks of existing
methods. We publish 18k RGB images from simulated colonoscopy with
corresponding depth and camera poses and make our data generation environment
in Unity publicly available. We evaluate different camera pose prediction
methods and demonstrate that, when trained on our data, they generalize to real
colonoscopy sequences and our bimodal approach outperforms prior unimodal work.
- Abstract(参考訳): 内視鏡的シーンの3次元構造を画像から推定することは非常に困難である。
変形とビュー依存照明に加えて、結腸のような管状構造は、自己排他的かつ反復的な解剖学的構造から生じる問題を提示する。
本稿では,大腸内視鏡におけるカメラポーズ推定のための合成データセットであるSimColと,内視鏡ポーズ予測のためのバイモーダル分布を明示的に学習する手法を提案する。
我々のデータセットは実際の大腸内視鏡の動きを再現し、既存の方法の欠点を強調します。
シミュレーション大腸内視鏡による18kのRGB画像とそれに対応する深度とカメラのポーズを公開し,Unityのデータ生成環境を一般公開した。
異なるカメラポーズ予測法を評価し,データに基づいてトレーニングすると,実際の大腸内視鏡のシーケンスに一般化し,このバイモーダルアプローチがユニモーダル作業よりも優れていることを示す。
関連論文リスト
- Cameras as Rays: Pose Estimation via Ray Diffusion [57.32374715650491]
カメラのポーズを推定することは3D再構築の基本的な課題であり、まばらな視点では依然として挑戦的である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - LightNeuS: Neural Surface Reconstruction in Endoscopy using Illumination
Decline [45.49984459497878]
単眼内視鏡で取得した画像から3次元再構成を行う手法を提案する。
第一に、内的空洞は水密であり、符号付き距離関数でモデル化することによって自然に強制される性質である。
第二に、シーンの照明は可変であり、それは内視鏡の光源から来ており、四角い距離と表面との逆転で崩壊する。
論文 参考訳(メタデータ) (2023-09-06T06:41:40Z) - SimCol3D -- 3D Reconstruction during Colonoscopy Challenge [28.115701091524606]
EndoVisのサブチャンジSimCol3Dは、大腸内視鏡におけるデータ駆動深度と予測の促進を目的としている。
仮想大腸内視鏡の深度予測は頑健に解けるが, ポーズ推定は未解決の課題である。
論文 参考訳(メタデータ) (2023-07-20T22:41:23Z) - The Drunkard's Odometry: Estimating Camera Motion in Deforming Scenes [79.00228778543553]
このデータセットは、3Dシーンの中で地上の真実を語る最初の大規模なカメラ軌道である。
リアルな3Dビルディングのシミュレーションでは、膨大な量のデータと地上の真実のラベルが得られます。
本稿では,光学的フロー推定を剛体カメラ運動に分解するDrunkard's Odometryと呼ばれる,変形可能な新しいオドメトリー法を提案する。
論文 参考訳(メタデータ) (2023-06-29T13:09:31Z) - SoftEnNet: Symbiotic Monocular Depth Estimation and Lumen Segmentation
for Colonoscopy Endorobots [2.9696400288366127]
大腸癌は世界で3番目に多いがん死の原因である。
視覚ベースの自律型内視鏡は大腸内視鏡の手順を大幅に改善することができる。
論文 参考訳(メタデータ) (2023-01-19T16:22:17Z) - C$^3$Fusion: Consistent Contrastive Colon Fusion, Towards Deep SLAM in
Colonoscopy [0.0]
光内視鏡(OC)による3D大腸再建による非検査面の検出は未解決の問題である。
近年の手法では,(1)フレーム・ツー・フレーム(あるいはフレーム・ツー・モデル)の予測が多くのトラッキング障害を引き起こし,(2)スキャン品質を犠牲にしてポイントベース表現に頼っている。
本稿では,これらの課題を終末まで解決し,定量的かつ定性的かつ堅牢な3次元大腸再建を実現するための新しい再構築フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-04T10:38:19Z) - Photometric single-view dense 3D reconstruction in endoscopy [2.094821665776961]
大腸内視鏡検査において,光度ステレオによるヒト大腸の3次元立体再構成を実現するために,制御光を利用する。
本手法は実際の医療環境下で機能し,適切な位置校正法と大腸管形状に適応した深さ推定法の両方を提供する。
論文 参考訳(メタデータ) (2022-04-19T18:23:31Z) - Tracking monocular camera pose and deformation for SLAM inside the human
body [2.094821665776961]
カメラのポーズと3Dシーンの変形を同時に追跡する新しい手法を提案する。
この方法は照明不変の測光法を用いて画像の特徴を追跡し、カメラの動きと変形を推定する。
以上の結果から, 複雑なシーンにおいて, 変形のレベルが増大する中で, 方法の精度とロバスト性を示すことが示唆された。
論文 参考訳(メタデータ) (2022-04-18T13:25:23Z) - Shelf-Supervised Mesh Prediction in the Wild [54.01373263260449]
本研究では,物体の3次元形状とポーズを1つの画像から推定する学習手法を提案する。
まず、カメラのポーズとともに、標準フレーム内の体積表現を推定する。
粗い体積予測はメッシュベースの表現に変換され、予測されたカメラフレームでさらに洗練される。
論文 参考訳(メタデータ) (2021-02-11T18:57:10Z) - Colonoscopy Polyp Detection: Domain Adaptation From Medical Report
Images to Real-time Videos [76.37907640271806]
大腸内視鏡画像と実時間映像の領域間ギャップに対処する画像-ビデオ結合型ポリープ検出ネットワーク(Ivy-Net)を提案する。
収集したデータセットの実験は、Ivy-Netが大腸内視鏡ビデオで最先端の結果を達成することを示した。
論文 参考訳(メタデータ) (2020-12-31T10:33:09Z) - 6D Camera Relocalization in Ambiguous Scenes via Continuous Multimodal
Inference [67.70859730448473]
あいまいさと不確かさを捉えるマルチモーダルカメラ再ローカライズフレームワークを提案する。
我々は、複数のカメラのポーズ仮説を予測し、それぞれの予測の不確実性も予測する。
あいまいな環境下でのカメラローカライゼーション研究を促進するための新しいデータセットを提案する。
論文 参考訳(メタデータ) (2020-04-09T20:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。