論文の概要: The Dresden Dataset for 4D Reconstruction of Non-Rigid Abdominal Surgical Scenes
- arxiv url: http://arxiv.org/abs/2603.02985v1
- Date: Tue, 03 Mar 2026 13:37:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.819177
- Title: The Dresden Dataset for 4D Reconstruction of Non-Rigid Abdominal Surgical Scenes
- Title(参考訳): 非リギッド腹部手術シーンの4次元再構成のためのドレスデンデータセット
- Authors: Reuben Docea, Rayan Younis, Yonghao Long, Maxime Fleury, Jinjing Xu, Chenyang Li, André Schulze, Ann Wierick, Johannes Bender, Micha Pfeiffer, Qi Dou, Martin Wagner, Stefanie Speidel,
- Abstract要約: D4Dデータセットは、変形する腹部軟部組織の3D再構成を評価するための、内視鏡的ビデオと高品質な構造化光幾何を提供する。
da Vinci Xiステレオ内視鏡とZivid構造化光カメラを用いて、6つのブタのキャデバーセッションからデータを得た。
このリソースは、非剛性SLAM、4D再構成、深さ推定方法の開発および評価のための総合的なベンチマークとして機能する。
- 参考スコア(独自算出の注目度): 20.77602532924985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The D4D Dataset provides paired endoscopic video and high-quality structured-light geometry for evaluating 3D reconstruction of deforming abdominal soft tissue in realistic surgical conditions. Data were acquired from six porcine cadaver sessions using a da Vinci Xi stereo endoscope and a Zivid structured-light camera, registered via optical tracking and manually curated iterative alignment methods. Three sequence types - whole deformations, incremental deformations, and moved-camera clips - probe algorithm robustness to non-rigid motion, deformation magnitude, and out-of-view updates. Each clip provides rectified stereo images, per-frame instrument masks, stereo depth, start/end structured-light point clouds, curated camera poses and camera intrinsics. In postprocessing, ICP and semi-automatic registration techniques are used to register data, and instrument masks are created. The dataset enables quantitative geometric evaluation in both visible and occluded regions, alongside photometric view-synthesis baselines. Comprising over 300,000 frames and 369 point clouds across 98 curated recordings, this resource can serve as a comprehensive benchmark for developing and evaluating non-rigid SLAM, 4D reconstruction, and depth estimation methods.
- Abstract(参考訳): D4D Datasetは、リアルな外科的条件下での腹部軟部組織の3D再構成を評価するために、内視鏡ビデオと高品質な構造化光の幾何学を提供する。
da Vinci Xiステレオ内視鏡とZivid構造化光カメラを用いて、6つのブタのキャダバーセッションからデータを取得し、光学的追跡と手動で反復的アライメント法で登録した。
3つのシーケンスタイプ - 全変形、インクリメンタルな変形、移動カメラクリップ - 非剛性運動に対するアルゴリズムの堅牢性、変形の大きさ、ビュー外更新。
それぞれのクリップには、修正されたステレオイメージ、フレームごとの楽器マスク、ステレオディープ、スタート/エンドの構造化点雲、キュレートされたカメラポーズ、カメラ固有の機能がある。
後処理では、ICPと半自動登録技術を用いてデータを登録し、計器マスクを作成する。
このデータセットは、可視領域と隠蔽領域の両方において、光度ビュー合成ベースラインとともに定量的な幾何的評価を可能にする。
300,000フレーム以上と369点の雲を98のキュレートされたレコードに収めることで、このリソースは、非厳密なSLAM、4D再構成、深さ推定方法の開発と評価のための総合的なベンチマークとして機能する。
関連論文リスト
- AI-Driven Three-Dimensional Reconstruction and Quantitative Analysis for Burn Injury Assessment [0.20308459813360544]
本稿では,光グラム計測,3次元表面再構成,深層学習に基づくセグメンテーションを統合したAIによるバーンアセスメント・マネジメントプラットフォームを提案する。
このシステムは患者固有の3D熱傷面を再構築し、熱傷領域を解剖学にマッピングし、現実の単位の客観的な測定値を計算する。
このプラットフォームは、構造化された患者の摂取、ガイド付き画像キャプチャ、3D分析と可視化、治療勧告、自動レポート生成をサポートする。
論文 参考訳(メタデータ) (2026-01-27T01:24:53Z) - Reflect3r: Single-View 3D Stereo Reconstruction Aided by Mirror Reflections [55.248092751290834]
ミラーリフレクションは日常の環境で一般的であり、単一のキャプチャ内でステレオ情報を提供することができる。
我々はこの特性を利用して、リフレクションを補助的な視点として扱い、物理的に有効な仮想カメラを構成する変換を設計する。
これにより、単一の画像から多視点ステレオ設定が可能となり、撮像プロセスが簡単になる。
論文 参考訳(メタデータ) (2025-09-24T23:00:22Z) - MapAnything: Universal Feed-Forward Metric 3D Reconstruction [63.79151976126576]
MapAnythingは1つ以上の画像を取り込み、カメラの内在性、ポーズ、深さ、部分的な再構築など、任意の幾何学的入力を行う。
そして、メーター3Dシーンの幾何学とカメラを直接補強する。
MapAnythingは、単一のフィードフォワードパスで幅広い3Dビジョンタスクに対処する。
論文 参考訳(メタデータ) (2025-09-16T18:00:14Z) - Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - EAR: Edge-Aware Reconstruction of 3-D vertebrae structures from bi-planar X-ray images [19.902946440205966]
本稿では,新しいエッジ・アウェア・コンストラクション・ネットワーク(EAR)を提案する。
自動エンコーダアーキテクチャをバックボーンとして,エッジアテンションモジュールと周波数拡張モジュールを提案する。
提案手法は3つの公開データセットを用いて評価し、4つの最先端モデルと比較した。
論文 参考訳(メタデータ) (2024-07-30T16:19:14Z) - FLex: Joint Pose and Dynamic Radiance Fields Optimization for Stereo Endoscopic Videos [79.50191812646125]
内視鏡的シーンの再構築は、外科手術後の分析から教育訓練まで、様々な医療応用にとって重要な要素である。
変形組織の非常にダイナミックな環境下での移動内視鏡の挑戦的なセットアップに着目する。
複数重重なり合う4次元ニューラルラジアンスフィールド(NeRF)への暗黙的なシーン分離と、再構成とカメラのスクラッチからのポーズを協調的に最適化するプログレッシブ最適化手法を提案する。
これにより、使いやすさが向上し、5000フレーム以上の手術ビデオの処理に間に合うように復元能力を拡張できる。
論文 参考訳(メタデータ) (2024-03-18T19:13:02Z) - Colonoscopy 3D Video Dataset with Paired Depth from 2D-3D Registration [1.1774995069145182]
大腸内視鏡におけるコンピュータビジョン手法のベンチマークのための3Dビデオデータセット(C3VD)を提案する。
そこで本研究では,光学ビデオシーケンスを,既知の3次元モデルの地上実写表示で登録するための,新しい2D-3D登録手法を提案する。
論文 参考訳(メタデータ) (2022-06-17T17:23:50Z) - 3D Reconstruction of Curvilinear Structures with Stereo Matching
DeepConvolutional Neural Networks [52.710012864395246]
本稿では,立体対における曲線構造の検出とマッチングのための完全自動パイプラインを提案する。
主に、TEM画像のステレオ対から転位を3次元再構成することに焦点を当てる。
論文 参考訳(メタデータ) (2021-10-14T23:05:47Z) - Stereo Dense Scene Reconstruction and Accurate Laparoscope Localization
for Learning-Based Navigation in Robot-Assisted Surgery [37.14020061063255]
微小侵襲手術(MIS)における解剖情報と腹腔鏡位置の計算はロボット支援手術ナビゲーションの基本ブロックである
本稿では,複雑な解剖学的構造の3次元再構成による画像誘導腹腔鏡像の局在化を実現するための学習駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-08T06:12:18Z) - Polka Lines: Learning Structured Illumination and Reconstruction for
Active Stereo [52.68109922159688]
本稿では,波動光学と幾何光学の両方に依存した,アクティブステレオのための新しい微分可能な画像形成モデルと,新しい三眼再構成ネットワークを提案する。
Polka Lines" を再現ネットワークと組み合わせた共同最適化パターンは, 撮像条件全体にわたって, 最先端のアクティブステレオ深度推定を達成している。
論文 参考訳(メタデータ) (2020-11-26T04:02:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。