論文の概要: DreamReg: Belief-Driven World Model for 2D-3D Ultrasound Registration
- arxiv url: http://arxiv.org/abs/2606.18825v1
- Date: Wed, 17 Jun 2026 08:56:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.073154
- Title: DreamReg: Belief-Driven World Model for 2D-3D Ultrasound Registration
- Title(参考訳): DreamReg: 2D-3D超音波登録のための信念駆動世界モデル
- Authors: Luoyao Kang, Yuelin Zhang, Jiwei Shan, Haifan Gong, Qingpeng Ding, Shing Shin Cheng,
- Abstract要約: 本研究では、2D-3Dの登録を剛性変換を更新する信念として定式化する信念駆動型世界モデルフレームワークであるDreamRegを提案する。
DreamRegは、過去の観察を要約して情報を提示し、学習されたダイナミクスを通じて変換を継続的に洗練する潜在的信念状態を維持している。
CAMUSとu-RegProデータセットの実験では、リアルタイムガイダンスのためのロバストネスと競合登録精度が改善された。
- 参考スコア(独自算出の注目度): 8.487805613758376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ultrasound (US) is widely used for surgical navigation, yet real-time registration between intraoperative 2D slices and preoperative 3D volumes remains challenging due to partial observability, speckle noise, and the action-dependent US acquisition. Existing methods are one-shot or short-horizon, making it hard for them to gather evidence over time or capture how surgeons adjust probe motion based on on-screen feedback. We propose DreamReg, a belief-driven world-model framework that formulates 2D-3D registration as belief updating over rigid transformations. DreamReg maintains a latent belief state that summarizes past observations and poses information, and continuously refines the transformation through learned dynamics as new slices arrive. During training, DreamReg is exposed to probe-motion trajectories that mimic clinical scanning behavior and learns to update its belief by conditioning pose refinement on the current US observation. During inference, DreamReg refines registration via internal imagination: it rolls out the learned world model to simulate candidate probe motions and their predicted observations, and integrates these imagined outcomes to converge to an accurate rigid transformation. Experiments on CAMUS and u-RegPro datasets demonstrate improved robustness and competitive registration accuracy for real-time guidance compared with state-of-the-art methods.
- Abstract(参考訳): 超音波(US)は外科的ナビゲーションに広く用いられているが,術中2Dスライスと術前3Dボリュームのリアルタイム登録は,部分的観察性,スペックルノイズ,行動に依存した米国の買収などにより困難である。
既存の方法はワンショットやショートホライゾンで、時間をかけて証拠を収集したり、外科医が画面上のフィードバックに基づいてプローブの動きを調整する方法を捉えたりすることは難しい。
本研究では、2D-3Dの登録を剛性変換を更新する信念として定式化する信念駆動型世界モデルフレームワークであるDreamRegを提案する。
DreamRegは、過去の観察を要約して情報を提示する潜在的信念を維持し、新しいスライスが到着するにつれて、学習されたダイナミクスを通じて変換を継続的に洗練する。
トレーニング中、DreamRegは、臨床スキャンの振る舞いを模倣するプローブモーションの軌跡に晒され、現在のアメリカの観測で改善の兆しを条件付けによってその信念を更新することを学ぶ。
推測の間、DreamRegは内部の想像力を通じて登録を洗練し、学習された世界モデルをロールアウトして、候補のプローブの動きと予測された観測をシミュレートし、これらの想像結果を統合して正確な厳密な変換に収束させる。
CAMUSとu-RegProデータセットの実験では、最先端の手法と比較して、リアルタイムガイダンスのための堅牢性と競合的な登録精度が改善された。
関連論文リスト
- WAM4D: Fast 4D World Action Model via Spatial Register Tokens [52.16661403052964]
WAM4Dは,軽量空間レジスタトークンを用いた高速4次元世界アクションモデルである。
WAM4Dは空間的整合性を向上し,効率的な推論を維持しつつ,競争力のある動作予測を実現する。
論文 参考訳(メタデータ) (2026-06-12T02:49:34Z) - Preoperative-to-intraoperative Liver Registration for Laparoscopic Surgery via Latent-Grounded Correspondence Constraints [51.7011449975586]
Land-Regは変形可能な登録フレームワークで、潜伏した2D-3Dのランドマーク対応を学習する。
厳格な登録のために、Land-Regはクロスモーダルラテントアライメントモジュールを採用している。
類似性マッチングを持つ不確実なオーバーラップランドマーク検出器を提案し, 明確な2D-3Dランドマーク対応を強く推定する。
論文 参考訳(メタデータ) (2026-03-02T10:44:03Z) - DreamPose3D: Hallucinative Diffusion with Prompt Learning for 3D Human Pose Estimation [18.240580699213197]
本研究では,3次元ポーズ推定のための行動認識推論と時間的想像力を組み合わせた拡散型フレームワークDreamPose3Dを紹介する。
DreamPose3Dは2次元ポーズシーケンスから抽出したタスク関連アクションプロンプトを用いて動的にデノナイズ処理を条件付け、ハイレベルなインテントをキャプチャする。
本研究では,関節間の構造的関係を効果的にモデル化するために,運動的関節親和性を注目機構に組み込んだ表現エンコーダを提案する。
幻覚的ポーズデコーダは、トレーニング中の時間的コヒーレントな3Dポーズを予測する。
論文 参考訳(メタデータ) (2025-11-12T17:31:41Z) - Lifting Motion to the 3D World via 2D Diffusion [19.64801640086107]
トレーニング用に2次元ポーズシーケンスのみを用いてグローバルな3次元動作を予測する新しいアプローチであるMVLiftを紹介する。
MVLiftは、人間のポーズ、人間とオブジェクトの相互作用、動物のポーズなど、さまざまな領域を一般化する。
論文 参考訳(メタデータ) (2024-11-27T23:26:56Z) - 4D Contrastive Superflows are Dense 3D Representation Learners [62.433137130087445]
我々は,LiDARとカメラのペアを連続的に利用して事前学習の目的を確立するための,新しいフレームワークであるSuperFlowを紹介する。
学習効率をさらに向上するため,カメラビューから抽出した知識の整合性を高めるプラグイン・アンド・プレイ・ビュー・一貫性モジュールを組み込んだ。
論文 参考訳(メタデータ) (2024-07-08T17:59:54Z) - Motion Degeneracy in Self-supervised Learning of Elevation Angle
Estimation for 2D Forward-Looking Sonar [4.683630397028384]
本研究は, 合成画像を用いた事前学習を行なわずに, 高度角推定の安定な自己教師付き学習を実現することを目的とする。
まず,主監督信号に関連する2次元前方ソナーの運動場を解析する。
論文 参考訳(メタデータ) (2023-07-30T08:06:11Z) - MoCaNet: Motion Retargeting in-the-wild via Canonicalization Networks [77.56526918859345]
そこで本研究では,制御された環境から3次元動作タスクを実現する新しいフレームワークを提案する。
モーションキャプチャシステムや3D再構成手順を使わずに、2Dモノクロ映像のキャラクタから3Dキャラクタへの体動を可能にする。
論文 参考訳(メタデータ) (2021-12-19T07:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。