Fugu-MT 論文翻訳(概要): Colonoscopy 3D Video Dataset with Paired Depth from 2D-3D Registration

論文の概要: Colonoscopy 3D Video Dataset with Paired Depth from 2D-3D Registration

arxiv url: http://arxiv.org/abs/2206.08903v1
Date: Fri, 17 Jun 2022 17:23:50 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-20 15:42:43.181429
Title: Colonoscopy 3D Video Dataset with Paired Depth from 2D-3D Registration
Title（参考訳）: 2D-3Dレジストレーションによる深度3次元ビデオデータセット
Authors: Taylor L. Bobrow, Mayank Golhar, Rohan Vijayan, Venkata S. Akshintala, Juan R. Garcia, and Nicholas J. Durr
Abstract要約: 大腸内視鏡におけるコンピュータビジョン手法のベンチマークのための3Dビデオデータセット(C3VD)を提案する。そこで本研究では,光学ビデオシーケンスを,既知の3次元モデルの地上実写表示で登録するための,新しい2D-3D登録手法を提案する。
参考スコア（独自算出の注目度）: 2.423769782993484
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Screening colonoscopy is an important clinical application for several 3D computer vision techniques, including depth estimation, surface reconstruction, and missing region detection. However, the development, evaluation, and comparison of these techniques in real colonoscopy videos remain largely qualitative due to the difficulty of acquiring ground truth data. In this work, we present a Colonoscopy 3D Video Dataset (C3VD) acquired with a high definition clinical colonoscope and high-fidelity colon models for benchmarking computer vision methods in colonoscopy. We introduce a novel multimodal 2D-3D registration technique to register optical video sequences with ground truth rendered views of a known 3D model. The different modalities are registered by transforming optical images to depth maps with a Generative Adversarial Network and aligning edge features with an evolutionary optimizer. This registration method achieves an average translation error of 0.321 millimeters and an average rotation error of 0.159 degrees in simulation experiments where error-free ground truth is available. The method also leverages video information, improving registration accuracy by 55.6% for translation and 60.4% for rotation compared to single frame registration. 22 short video sequences were registered to generate 10,015 total frames with paired ground truth depth, surface normals, optical flow, occlusion, six degree-of-freedom pose, coverage maps, and 3D models. The dataset also includes screening videos acquired by a gastroenterologist with paired ground truth pose and 3D surface models. The dataset and registration source code are available at durr.jhu.edu/C3VD.
Abstract（参考訳）: スクリーニング大腸内視鏡は,深度推定,表面再構成,欠損領域検出など,いくつかの3次元コンピュータビジョン技術における重要な臨床応用である。しかし,実際の大腸内視鏡映像におけるこれらの手法の開発と評価,比較は,真理データ取得の難しさから定性的なままである。本稿では,高精細度大腸内視鏡と高精細度大腸モデルを用いて取得した大腸内視鏡3dビデオデータセット(c3vd)について紹介する。本稿では, 既知の3次元モデルの基底真理レンダリングを用いた光学映像列を登録する, 新規なマルチモーダル2d-3d登録手法を提案する。光画像からデプスマップへジェネレーティブ・アドバイサル・ネットワークで変換し、エッジ特徴を進化最適化器で整列することで、様々なモダリティが登録される。この登録法は, 誤差のない地上真実が利用できるシミュレーション実験において, 平均翻訳誤差0.321mm, 平均回転誤差0.159度を達成する。また、ビデオ情報を利用して、翻訳の登録精度を55.6%向上し、回転の60.4%向上させる。 22の短いビデオシーケンスが登録され、ペア化された地上の真理深度、表面の正常度、光学的流れ、閉塞度、6自由度ポーズ、カバレッジマップ、および3Dモデルで10,015フレームを生成する。このデータセットには、胃腸科医が取得した3Dサーフェスモデルを用いたスクリーニングビデオも含まれている。データセットと登録ソースコードは durr.jhu.edu/C3VD で入手できる。

関連論文リスト

ColonAdapter: Geometry Estimation Through Foundation Model Adaptation for Colonoscopy [18.844097623387974]
単眼の大腸内視鏡像から3次元形状を推定することは、非ランベルト面、移動光源、大きなテクスチャのない領域のために困難である。大腸内視鏡の幾何学的基礎モデルに適応する自己教師型微調整フレームワークであるColonAdapterを提案する。
論文参考訳（メタデータ） (2025-11-27T09:21:11Z)
ColonCrafter: A Depth Estimation Model for Colonoscopy Videos Using Diffusion Priors [1.9437590375121516]
ColonCrafterは拡散に基づく深度推定モデルであり、単眼の大腸内視鏡ビデオから時間的に一貫した深度マップを生成する。本手法は, 時間的に一貫した深度マップを生成するために, 合成大腸内視鏡の配列から頑健な幾何学的先行を学習する。
論文参考訳（メタデータ） (2025-09-16T20:40:22Z)
C3VDv2 -- Colonoscopy 3D video dataset with enhanced realism [1.1774995069145182]
本稿では,高精細3Dビデオデータセットの第2版(v2)であるC3VDv2を紹介する。 192個のビデオシーケンスは60個の特異な高忠実度シリコーン大腸ファントムセグメントで撮影された。消化器科医が取得した8つのシミュレートされた大腸内視鏡ビデオには、真実のポーズが提供されている。データセットには、質的評価のための大腸変形を特徴とする15のビデオが含まれている。
論文参考訳（メタデータ） (2025-06-30T17:29:06Z)
Acquiring Submillimeter-Accurate Multi-Task Vision Datasets for Computer-Assisted Orthopedic Surgery [0.9268994664916388]
整形外科手術における3次元再構成と特徴マッチングに適した現実的で正確な生体外データセットを生成する。平均3次元ユークリッド誤差0.35mmは3次元基底真理に対して達成される。これにより、将来的な外科的データセットの取得の扉が開かれ、高精度な応用が可能となる。
論文参考訳（メタデータ） (2025-01-26T02:52:46Z)
UVRM: A Scalable 3D Reconstruction Model from Unposed Videos [68.34221167200259]
従来の2次元視覚データを用いた3D再構成モデルのトレーニングには、トレーニングサンプルのカメラポーズに関する事前知識が必要である。 UVRMは、ポーズに関する情報を必要とせず、単眼ビデオでトレーニングし、評価できる新しい3D再構成モデルである。
論文参考訳（メタデータ） (2025-01-16T08:00:17Z)
MedTet: An Online Motion Model for 4D Heart Reconstruction [59.74234226055964]
本研究は, 術後の軽度データから3次元心臓運動を再構築するための新しいアプローチを提案する。既存の方法では、フル3次元の体積像から3次元の臓器のジオメトリーを正確に再構築することができる。このような部分的データから3次元運動を再構築するための汎用的なフレームワークを提案する。
論文参考訳（メタデータ） (2024-12-03T17:18:33Z)
Rigid Single-Slice-in-Volume registration via rotation-equivariant 2D/3D feature matching [3.041742847777409]
本研究では,1つの2次元スライスと対応する3次元ボリュームを一致させる自己教師付き2D/3D登録手法を提案する。 NSCLC-Radiomics CTおよびKIRBY21 MRIデータセット上で,提案したスライス・イン・ボリューム登録の堅牢性を示す。
論文参考訳（メタデータ） (2024-10-24T12:24:27Z)
SALVE: A 3D Reconstruction Benchmark of Wounds from Consumer-grade Videos [20.69257610322339]
本稿では,消費者向けビデオからの3次元創傷再建について述べる。 SALVEデータセットを導入し、異なるカメラで捉えた現実的な創傷ファントムのビデオ記録を含む。我々は,従来のフォトグラメトリーパイプラインから高度なニューラルレンダリングアプローチまで,最先端の3次元再構成手法の精度と精度を評価する。
論文参考訳（メタデータ） (2024-07-29T02:34:51Z)
Sparse Points to Dense Clouds: Enhancing 3D Detection with Limited LiDAR Data [68.18735997052265]
単分子と点雲に基づく3次元検出の利点を組み合わせたバランスの取れたアプローチを提案する。本手法では,低コストで低解像度のセンサから得られる3Dポイントを少数必要としている。 3次元検出の精度は最先端の単分子検出法と比較して20%向上する。
論文参考訳（メタデータ） (2024-04-10T03:54:53Z)
Generative Enhancement for 3D Medical Images [74.17066529847546]
本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。 3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文参考訳（メタデータ） (2024-03-19T15:57:04Z)
Domain adaptation strategies for 3D reconstruction of the lumbar spine using real fluoroscopy data [9.21828361691977]
本研究は整形外科手術における手術ナビゲーション導入における重要な障害に対処するものである。これは、少数の蛍光画像から脊椎の3次元解剖モデルを生成するためのアプローチを示す。これまでの合成データに基づく研究の精度に匹敵する84%のF1スコアを達成しました。
論文参考訳（メタデータ） (2024-01-29T10:22:45Z)
On the Localization of Ultrasound Image Slices within Point Distribution Models [84.27083443424408]
甲状腺疾患は高分解能超音波(US)で診断されることが多い縦断追跡は病理甲状腺形態の変化をモニタリングするための重要な診断プロトコルである。 3次元形状表現におけるUS画像の自動スライスローカライズのためのフレームワークを提案する。
論文参考訳（メタデータ） (2023-09-01T10:10:46Z)
Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文参考訳（メタデータ） (2023-03-26T14:38:42Z)
Oral-3Dv2: 3D Oral Reconstruction from Panoramic X-Ray Imaging with Implicit Neural Representation [3.8215162658168524]
Oral-3Dv2は、単一のパノラマX線画像から3Dラジオロジーを再構成する非逆学習モデルである。本モデルは,2次元座標を3次元空間内のボクセルの密度値にマッピングすることにより,暗黙的に3次元口腔構造を表現することを学習する。我々の知る限りでは、これは1枚のパノラマX線画像から3Dラジオグラフィ再構成における非逆学習モデルの最初の作品である。
論文参考訳（メタデータ） (2023-03-21T18:17:27Z)
CNN-based real-time 2D-3D deformable registration from a single X-ray projection [2.1198879079315573]
本稿では, フルオロスコープ画像を用いたリアルタイム2D-3D非剛体登録法を提案する。術前スキャンから解剖学の変位場と2次元投影からなるデータセットを生成する。ニューラルネットワークは、未知の3D変位場を単一の投影画像から回復するように訓練される。
論文参考訳（メタデータ） (2022-12-15T09:57:19Z)
Automated Model Design and Benchmarking of 3D Deep Learning Models for COVID-19 Detection with Chest CT Scans [72.04652116817238]
3D胸部CTスキャン分類のための3D DLモデルを自動的に検索するための差別化可能なニューラルネットワーク探索(DNAS)フレームワークを提案する。また,我々のモデルのクラスアクティベーションマッピング(cam)技術を利用して,結果の解釈可能性を提供する。
論文参考訳（メタデータ） (2021-01-14T03:45:01Z)
Revisiting 3D Context Modeling with Supervised Pre-training for Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文参考訳（メタデータ） (2020-12-16T07:11:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。