論文の概要: BronchoPose: an analysis of data and model configuration for
vision-based bronchoscopy pose estimation
- arxiv url: http://arxiv.org/abs/2204.11982v1
- Date: Mon, 25 Apr 2022 22:17:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 13:34:09.686118
- Title: BronchoPose: an analysis of data and model configuration for
vision-based bronchoscopy pose estimation
- Title(参考訳): BronchoPose:視覚型気管支鏡のポーズ推定のためのデータとモデル構成の分析
- Authors: Juan Borrego-Carazo, Carles S\'anchez, David Castells-Rufas, Jordi
Carrabina, D\'ebora Gil
- Abstract要約: VB(Vision-based bronchoscopy)モデルでは、生検中に有効なガイダンスを提供するために、ビデオ気管支鏡のフレームで仮想肺モデルを登録する必要がある。
近年のニューラルネットワークと時間的画像処理の進歩は, 気管支鏡の新たな可能性をもたらした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Vision-based bronchoscopy (VB) models require the registration of the virtual
lung model with the frames from the video bronchoscopy to provide effective
guidance during the biopsy. The registration can be achieved by either tracking
the position and orientation of the bronchoscopy camera or by calibrating its
deviation from the pose (position and orientation) simulated in the virtual
lung model. Recent advances in neural networks and temporal image processing
have provided new opportunities for guided bronchoscopy. However, such progress
has been hindered by the lack of comparative experimental conditions.
In the present paper, we share a novel synthetic dataset allowing for a fair
comparison of methods. Moreover, this paper investigates several neural network
architectures for the learning of temporal information at different levels of
subject personalization. In order to improve orientation measurement, we also
present a standardized comparison framework and a novel metric for camera
orientation learning. Results on the dataset show that the proposed metric and
architectures, as well as the standardized conditions, provide notable
improvements to current state-of-the-art camera pose estimation in video
bronchoscopy.
- Abstract(参考訳): vision-based bronchoscopy (vb)モデルでは、ビデオ気管支鏡からのフレームと仮想肺モデルの登録が必要であり、生検時に効果的な指導を提供する。
この登録は、気管支鏡カメラの位置と向きを追跡するか、または仮想肺モデルでシミュレートされたポーズ(位置と方向)からの偏差を校正することにより達成できる。
近年のニューラルネットワークと時間的画像処理の進歩は,気管支鏡の新たな可能性をもたらした。
しかし、このような進歩は比較実験条件の欠如によって妨げられている。
本稿では,手法の公平な比較を可能にする新しい合成データセットを提案する。
さらに、被験者のパーソナライゼーションの異なるレベルにおける時間情報学習のためのニューラルネットワークアーキテクチャについて検討する。
また、方位測定を改善するために、カメラ指向学習のための標準比較フレームワークと新しいメトリックを提案する。
分析結果から, 提案した計測値とアーキテクチャ, および標準化条件は, ビデオ気管支鏡における現況カメラのポーズ推定に顕著な改善をもたらすことが示された。
関連論文リスト
- RIDE: Self-Supervised Learning of Rotation-Equivariant Keypoint
Detection and Invariant Description for Endoscopy [83.4885991036141]
RIDEは回転同変検出と不変記述のための学習に基づく手法である。
内視鏡画像の大規模なキュレーションを自己指導的に行う。
マッチングと相対的なポーズ推定タスクに対して、最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2023-09-18T08:16:30Z) - MedFMC: A Real-world Dataset and Benchmark For Foundation Model
Adaptation in Medical Image Classification [41.16626194300303]
ファンデーションモデルは、多くの場合、大規模なデータで事前訓練されているが、様々なビジョンや言語アプリケーションのジャンプ開始において、最も成功している。
最近の進歩により、下流タスクにおける基礎モデルの適応は、少数のトレーニングサンプルだけで効率的に行えるようになった。
しかし, 医用画像解析におけるそのような学習パラダイムの適用は, 一般に公開されているデータやベンチマークが不足しているため, 依然として少ない。
論文 参考訳(メタデータ) (2023-06-16T01:46:07Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Weakly Supervised Airway Orifice Segmentation in Video Bronchoscopy [0.0]
本論文は気管支鏡視下気管支鏡視下における気管支拡張術の自動化について述べる。
このタスクに対するディープラーニングベースのアプローチは、現在、容易に利用できる真実のセグメンテーションデータが欠如しているため、妨げられている。
我々はk平均からなるデータ駆動パイプラインと、コンパクトなマーカーベースの流域アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-24T12:18:25Z) - REGAS: REspiratory-GAted Synthesis of Views for Multi-Phase CBCT
Reconstruction from a single 3D CBCT Acquisition [75.64791080418162]
REGASは、アンダーサンプドトモグラフィビューを合成し、再構成画像中のアーティファクトのエイリアスを緩和する自己教師手法を提案する。
高解像度4Dデータ上でのディープニューラルネットワークの大規模なメモリコストに対処するため、REGASは分散して微分可能なフォワードプロジェクションを可能にする新しいレイパス変換(RPT)を導入した。
論文 参考訳(メタデータ) (2022-08-17T03:42:19Z) - OADAT: Experimental and Synthetic Clinical Optoacoustic Data for
Standardized Image Processing [62.993663757843464]
オプトアコースティック(OA)イメージングは、ナノ秒レーザーパルスによる生体組織の励起と、光吸収による熱弾性膨張によって発生する超音波の検出に基づいている。
OAイメージングは、深部組織における豊富な光学コントラストと高分解能の強力な組み合わせを特徴としている。
臨床環境でのOAの幅広い応用を促進するために、異なるタイプの実験的なセットアップと関連する処理手法で生成される標準化データセットは存在しない。
論文 参考訳(メタデータ) (2022-06-17T08:11:26Z) - Tracking monocular camera pose and deformation for SLAM inside the human
body [2.094821665776961]
カメラのポーズと3Dシーンの変形を同時に追跡する新しい手法を提案する。
この方法は照明不変の測光法を用いて画像の特徴を追跡し、カメラの動きと変形を推定する。
以上の結果から, 複雑なシーンにおいて, 変形のレベルが増大する中で, 方法の精度とロバスト性を示すことが示唆された。
論文 参考訳(メタデータ) (2022-04-18T13:25:23Z) - A Temporal Learning Approach to Inpainting Endoscopic Specularities and
Its effect on Image Correspondence [13.25903945009516]
本稿では,時間的生成的対位ネットワーク(GAN)を用いて,隠蔽解剖学を特異性の下で描くことを提案する。
これは、胃内視鏡(Hyper-Kvasir)の生検データを用いて、完全に教師なしの方法で達成される。
また,3次元再構成とカメラモーション推定の基盤となるコンピュータビジョンタスクにおける本手法の有効性を評価する。
論文 参考訳(メタデータ) (2022-03-31T13:14:00Z) - Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。
提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。
実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-24T08:11:34Z) - Appearance Learning for Image-based Motion Estimation in Tomography [60.980769164955454]
トモグラフィー画像では、取得した信号に擬似逆フォワードモデルを適用することにより、解剖学的構造を再構成する。
患者の動きは、復元過程における幾何学的アライメントを損なうため、運動アーティファクトが生じる。
本研究では,スキャン対象から独立して剛性運動の構造を認識する外観学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-18T09:49:11Z) - An Adversarial Approach for the Robust Classification of Pneumonia from
Chest Radiographs [9.462808515258464]
ディープラーニングモデルは、しばしばデータセットシフトによるパフォーマンス損失を示す。
1つの病院システムからのデータを用いてトレーニングされたモデルは、同一病院のデータでテストすると高い予測性能を得るが、異なる病院システムでテストした場合は著しく悪化する。
我々は,共同創設者に依存しないより堅牢なモデルを学ぶことができる,逆最適化に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-13T03:49:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。