論文の概要: C3VD-DEFCOL: A Deformable Colonoscopy Dataset with Time-Resolved 3D Ground Truth and Realistic Appearance
- arxiv url: http://arxiv.org/abs/2606.07891v1
- Date: Fri, 05 Jun 2026 22:59:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.515154
- Title: C3VD-DEFCOL: A Deformable Colonoscopy Dataset with Time-Resolved 3D Ground Truth and Realistic Appearance
- Title(参考訳): C3VD-DEFCOL: 時間分解型3次元地表面真理とリアルな外観を持つ変形性大腸内視鏡データセット
- Authors: Ethan Luk, Mayank V. Golhar, Anthony Song, Raúl Iranzo, Víctor M. Batlle, Lalithkumar Seenivasan, José M. M. Montiel, Nicholas J. Durr,
- Abstract要約: C3VD-DEFCOL(C3VD-DEFCOL)について述べる。
C3VD-DEFCOLは、変形可能な3D再構成アルゴリズムをテストするための再現可能な定量的評価プラットフォームとして設計されている。
- 参考スコア(独自算出の注目度): 2.1290430772503415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D reconstruction could improve colonoscopy by estimating mucosal coverage and alerting clinicians to missed regions during screening. However, algorithm development is limited as no current datasets provide both a realistic in vivo appearance and dense, time-resolved 3D ground truth, especially under non-rigid deformation. We present C3VD-DEFCOL, a framework and dataset for evaluating deformable colonoscopy reconstruction with paired geometry and realistic texture. Starting from C3VD/C3VDv2 colon meshes and camera trajectories, we generate controlled deformations of the colon surface, including peristaltic waves and centerline motion, and render per-frame depth, surface normals, optical flow, camera poses, and time-stamped 3D meshes. We then use the rendered geometry, primarily depth, to condition an LTX-2.3-based sim-to-real translation model that produces RGB clips with in vivo-like mucosal color, texture, vasculature, and specular appearance while preserving the underlying 3D scene structure. The resulting dataset contains 110 videos from 11 unique colon mesh geometries, with varying camera trajectories, appearances, and parameterized deformation regimes, including three peristaltic severity levels that serve as controlled evaluation axes. We evaluate the generated videos using appearance realism, geometric consistency, and temporal consistency metrics, and use the paired ground truth to benchmark the downstream task of pose estimation in deformable 3D reconstruction. Our experiments show how pose estimation error increases with increasing deformation severity, providing a controlled stress test that is not possible with existing in vivo datasets. Overall, C3VD-DEFCOL is designed as a reproducible, quantitative evaluation platform for testing deformable 3D reconstruction algorithms, with the goal of reducing the domain gap between synthetic datasets and in vivo colonoscopy.
- Abstract(参考訳): 3D再建は粘膜被覆率を推定し,検診中に臨床医に再発部位を警告することにより大腸内視鏡を改善できると考えられた。
しかし、アルゴリズムの開発は、現在のデータセットが現実的なインビボの外観と、特に非剛体変形下での高密度で時間分解された3D地上真実の両方を提供するため、制限されている。
C3VD-DEFCOL(C3VD-DEFCOL)について述べる。
C3VD/C3VDv2のコロンメッシュとカメラトラジェクトリから、直近波や中心運動を含む大腸表面の制御された変形を生成し、フレームごとの深さ、表面の正規度、光学フロー、カメラポーズ、タイムスタンプされた3Dメッシュをレンダリングする。
次に,下層の3Dシーン構造を保ちながら,生体内様の粘膜色,テクスチャ,血管,および特異な外観のRGBクリップを生成するLTX-2.3ベースのsim-to-real翻訳モデルを記述する。
得られたデータセットには、11の独自のメッシュ測地から110の動画が含まれており、様々なカメラの軌跡、外観、パラメータ化された変形機構があり、その中には、制御された評価軸として機能する3つの周囲の重大度レベルが含まれている。
出現リアリズム, 幾何整合性, 時間整合性の測定値を用いて生成した映像を評価し, 対の基底真理を用いて, 変形可能な3次元再構成におけるポーズ推定のダウンストリームタスクをベンチマークした。
提案実験は, 変形重大度の増加に伴うポーズ推定誤差の増加を示し, 既存の生体内データセットでは不可能な, 制御されたストレステストを提供する。
全体として、C3VD-DEFCOLは、変形可能な3次元再構成アルゴリズムをテストするための再現可能な定量的評価プラットフォームとして設計されており、合成データセットと生体内大腸内視鏡の領域ギャップを減らすことを目的としている。
関連論文リスト
- RealSynCol: a high-fidelity synthetic colon dataset for 3D reconstruction applications [33.26682919703966]
本研究では, 内視鏡環境を再現する高度にリアルな合成データセットであるRealSynColを提案する。
得られたデータセットは28,130フレームで構成され、地上の真理深度マップ、光学フロー、3Dメッシュ、カメラ軌道と組み合わせられる。
その結果, RealSynColの高現実性と可変性は臨床画像の一般化性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2026-02-09T08:57:37Z) - Robust Mesh Saliency GT Acquisition in VR via View Cone Sampling and Geometric Smoothing [59.12032628787018]
バーチャルリアリティー(VR)における人中心視覚モデリングには3次元メッシュサリエンシ基底真理が不可欠である
現在のVRアイトラッキングパイプラインは、単一線サンプリングとユークリッドのスムース化に依存しており、テクスチャの注意を喚起し、ギャップをまたいだ信号の漏洩を引き起こす。
本稿では,これらの制約に対処する頑健な枠組みを提案する。
論文 参考訳(メタデータ) (2026-01-06T05:20:12Z) - ColonAdapter: Geometry Estimation Through Foundation Model Adaptation for Colonoscopy [18.844097623387974]
単眼の大腸内視鏡像から3次元形状を推定することは、非ランベルト面、移動光源、大きなテクスチャのない領域のために困難である。
大腸内視鏡の幾何学的基礎モデルに適応する自己教師型微調整フレームワークであるColonAdapterを提案する。
論文 参考訳(メタデータ) (2025-11-27T09:21:11Z) - C3VDv2 -- Colonoscopy 3D video dataset with enhanced realism [1.1531098736643364]
本稿では,高精細3Dビデオデータセットの第2版(v2)であるC3VDv2を紹介する。
計169,371フレームの192の動画は、60のユニークな高忠実度シリコーン大腸ファントムセグメントで撮影された。
消化器科医が取得した8つのシミュレートされた大腸内視鏡ビデオには、真実のポーズが提供されている。
データセットには、質的評価のための大腸変形を備えた15のビデオが含まれている。
論文 参考訳(メタデータ) (2025-06-30T17:29:06Z) - R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation [78.26308457952636]
本稿では,自律運転シミュレーションの限界を克服する軽量な1ステップ拡散モデルであるR3D2を紹介する。
シャドウや一貫した照明など、妥当なレンダリング効果を生み出すことで、既存のシーンに完全な3Dアセットを現実的に挿入することができる。
R3D2は挿入されたアセットの現実性を大幅に向上させ,テキストから3Dへのアセット挿入やクロスシーン/データセットオブジェクト転送といったユースケースを可能にした。
論文 参考訳(メタデータ) (2025-06-09T14:50:19Z) - Dynamic 3D Point Cloud Sequences as 2D Videos [81.46246338686478]
3Dポイントクラウドシーケンスは、現実世界の環境における最も一般的で実用的な表現の1つとして機能する。
textitStructured Point Cloud Videos (SPCV) と呼ばれる新しい汎用表現を提案する。
SPCVは点雲列を空間的滑らかさと時間的一貫性を持つ2Dビデオとして再編成し、画素値は点の3D座標に対応する。
論文 参考訳(メタデータ) (2024-03-02T08:18:57Z) - The Drunkard's Odometry: Estimating Camera Motion in Deforming Scenes [79.00228778543553]
このデータセットは、3Dシーンの中で地上の真実を語る最初の大規模なカメラ軌道である。
リアルな3Dビルディングのシミュレーションでは、膨大な量のデータと地上の真実のラベルが得られます。
本稿では,光学的フロー推定を剛体カメラ運動に分解するDrunkard's Odometryと呼ばれる,変形可能な新しいオドメトリー法を提案する。
論文 参考訳(メタデータ) (2023-06-29T13:09:31Z) - 3D shape reconstruction of semi-transparent worms [0.950214811819847]
3D形状の再構成は通常、被写体の複数の画像に物体の特徴やテクスチャを特定する必要がある。
ここでは、画像と比較するために、適応的ぼかしと透明度で候補形状を描画することで、これらの課題を克服する。
本研究は,線虫類の細いカエノルハブディティ・エレガンスを,生物学的にインフォームドされた制約や規則化を自然に許容する内在的パラメトリションを用いて3次元曲線としてモデル化する。
論文 参考訳(メタデータ) (2023-04-28T13:29:36Z) - A geometry-aware deep network for depth estimation in monocular
endoscopy [17.425158094539462]
提案手法は,異なるデータセットと臨床画像にまたがって広範囲に検証されている。
提案法の平均RMSE値は12.604(T1-L1)、9.930(T2-L2)、13.893(Colon)である。
論文 参考訳(メタデータ) (2023-04-20T11:59:32Z) - 3D Reconstruction of Curvilinear Structures with Stereo Matching
DeepConvolutional Neural Networks [52.710012864395246]
本稿では,立体対における曲線構造の検出とマッチングのための完全自動パイプラインを提案する。
主に、TEM画像のステレオ対から転位を3次元再構成することに焦点を当てる。
論文 参考訳(メタデータ) (2021-10-14T23:05:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。