論文の概要: Constrained Visual-Inertial Localization With Application And Benchmark
in Laparoscopic Surgery
- arxiv url: http://arxiv.org/abs/2202.11075v1
- Date: Tue, 22 Feb 2022 18:01:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 17:22:45.214962
- Title: Constrained Visual-Inertial Localization With Application And Benchmark
in Laparoscopic Surgery
- Title(参考訳): 腹腔鏡下手術における視覚-慣性局在の応用とベンチマーク
- Authors: Regine Hartwig, Daniel Ostler, Jean-Claude Rosenthal, Hubertus
Feu{\ss}ner, Dirk Wilhelm, Dirk Wollherr
- Abstract要約: 本稿では,制約のあるカメラ動作に対する視覚-慣性位置決め問題に対処する新しい手法を提案する。
我々は、グローバルなコスト関数を協調的に最適化するために、異なるモダリティからの残留物を使用する。
適切な医療症例において本手法の利点を検証し,腹部に最小侵襲で手術を施したデータセットを作成した。
- 参考スコア(独自算出の注目度): 5.602880243609329
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We propose a novel method to tackle the visual-inertial localization problem
for constrained camera movements. We use residuals from the different
modalities to jointly optimize a global cost function. The residuals emerge
from IMU measurements, stereoscopic feature points, and constraints on possible
solutions in SE(3). In settings where dynamic disturbances are frequent, the
residuals reduce the complexity of the problem and make localization feasible.
We verify the advantages of our method in a suitable medical use case and
produce a dataset capturing a minimally invasive surgery in the abdomen. Our
novel clinical dataset MITI is comparable to state-of-the-art evaluation
datasets, contains calibration and synchronization and is available at
https://mediatum.ub.tum.de/1621941.
- Abstract(参考訳): 制約のあるカメラ動作に対する視覚-慣性位置決め問題に対処する新しい手法を提案する。
我々は、グローバルコスト関数を共同で最適化するために、異なるモダリティの残差を使用する。
残基は、IMU測定、立体的特徴点、SE(3)の可能な解に対する制約から生じる。
動的乱れが頻発する環境では、残差は問題の複雑さを減らし、局所化を可能にする。
適切な医療症例において本手法の利点を検証し,腹部に最小侵襲で手術を施したデータセットを作成した。
新しい臨床データセットmitiは最先端の評価データセットに匹敵し、キャリブレーションと同期が含まれており、https://mediatum.ub.tum.de/1621941で利用可能である。
関連論文リスト
- Improving 3D Medical Image Segmentation at Boundary Regions using Local Self-attention and Global Volume Mixing [14.0825980706386]
ボリューム・メディカル・イメージ・セグメンテーションは、与えられた3次元ボリューム・メディカル・イメージをボクセルレベルの精度で正確に分類することを目的とする医用画像解析の基本的な問題である。
本研究では,3次元医用画像セグメンテーションにおける局所的およびグローバルな依存関係を明示的に捉えることを目的とした,階層型エンコーダデコーダベースの新しいフレームワークを提案する。
提案フレームワークは,局所的なボリュームベースの自己アテンションを利用して局所的な依存関係を高解像度でエンコードし,低解像度の特徴表現でグローバルな依存関係をキャプチャする新しいボリュームミキサを導入する。
論文 参考訳(メタデータ) (2024-10-20T11:08:38Z) - Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - ViTALS: Vision Transformer for Action Localization in Surgical Nephrectomy [7.145773305697571]
UroSliceと呼ばれる新しい腎摘出術のデータセットを紹介した。
これらのビデオからアクションローカライズを行うために,ViTALSと呼ばれる新しいモデルを提案する。
本モデルでは,階層的拡張時間的畳み込み層と層間残差接続を組み込んで,より微細な時間的相関と粗い粒度を捉える。
論文 参考訳(メタデータ) (2024-05-04T05:07:39Z) - CycleINR: Cycle Implicit Neural Representation for Arbitrary-Scale Volumetric Super-Resolution of Medical Data [19.085329423308938]
CycleINRは、3次元医療データの超高解像度化のための新しい拡張インプリシトニューラルネットワーク表現モデルである。
そこで我々は,Slice-wise Noise Level Inconsistency (SNLI) を新たに導入し,Slice-wise noise Level inconsistency (SNLI) を定量的に評価する。
論文 参考訳(メタデータ) (2024-04-07T08:48:01Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Cross-Dataset Adaptation for Instrument Classification in Cataract
Surgery Videos [54.1843419649895]
特定のデータセットでこのタスクをうまく実行する最先端モデルでは、別のデータセットでテストすると、パフォーマンスが低下する。
本稿では,Barlow Adaptorと呼ばれる新しいエンドツーエンドのUnsupervised Domain Adaptation (UDA)手法を提案する。
さらに,BFAL(Barlow Feature Alignment Loss)と呼ばれる,異なるドメインにまたがる特徴を整列させる新たな損失を導入する。
論文 参考訳(メタデータ) (2023-07-31T18:14:18Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Data-Consistent Local Superresolution for Medical Imaging [5.025654873456756]
フルトモグラフィー画像の再構築後、臨床医は画像のいくつかの重要な部分が十分に明確でないと信じ、これらの領域をより透明にしたいと考えるかもしれない。
単純なアプローチ(推奨されない)では、高解像度画像のグローバルな再構築を行う。
本稿では,関心領域のズームインと精細化をリアルタイムに行うための反復モデルベース再構成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-22T13:18:38Z) - FedMed-ATL: Misaligned Unpaired Brain Image Synthesis via Affine
Transform Loss [58.58979566599889]
脳画像合成のための新しい自己教師型学習(FedMed)を提案する。
アフィン変換損失(ATL)は、プライバシー法に違反することなく、ひどく歪んだ画像を使用するように定式化された。
提案手法は, 極めて不整合かつ不整合なデータ設定下での合成結果の品質の両方において, 高度な性能を示す。
論文 参考訳(メタデータ) (2022-01-29T13:45:39Z) - HarmoFL: Harmonizing Local and Global Drifts in Federated Learning on
Heterogeneous Medical Images [19.62267284815759]
我々は、ローカルドリフトとグローバルドリフトの両方を扱う、HarmoFLと呼ばれる新しいフレームワークを紹介した。
HarmoFLは、周波数領域に変換された画像の振幅を正規化することにより、ローカル更新ドリフトを緩和する。
我々はHarmoFLが、期待できる収束挙動を持つ最新の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-12-20T13:25:48Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。