論文の概要: EndoControlMag: Robust Endoscopic Vascular Motion Magnification with Periodic Reference Resetting and Hierarchical Tissue-aware Dual-Mask Contro
- arxiv url: http://arxiv.org/abs/2507.15292v2
- Date: Tue, 22 Jul 2025 05:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 13:10:14.752856
- Title: EndoControlMag: Robust Endoscopic Vascular Motion Magnification with Periodic Reference Resetting and Hierarchical Tissue-aware Dual-Mask Contro
- Title(参考訳): EndoControlMag: 周期的基準設定と階層的組織対応Dual-Mask Controを併用したロバスト内視鏡的血管運動拡大術
- Authors: An Wanga, Rulin Zhou, Mengya Xu, Yiru Ye, Longfei Gou, Yiting Chang, Hao Chen, Chwee Ming Lim, Jiankun Wang, Hongliang Ren,
- Abstract要約: 本研究では,内視鏡環境に適合したマスク条件の血管運動拡大機能を備えたトレーニングフリーフレームワークであるEndoControlMagを紹介する。
提案手法は2つの重要なモジュールを特徴付ける: エラーの蓄積を防ぐために、動画を動的に更新された参照フレームでショートオーバーラップするクリップに分割する定期参照リセット方式。
本研究では,EndoVMM24データセット上でのEndoControlMagの評価を行った。
- 参考スコア(独自算出の注目度): 9.521848289595649
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Visualizing subtle vascular motions in endoscopic surgery is crucial for surgical precision and decision-making, yet remains challenging due to the complex and dynamic nature of surgical scenes. To address this, we introduce EndoControlMag, a training-free, Lagrangian-based framework with mask-conditioned vascular motion magnification tailored to endoscopic environments. Our approach features two key modules: a Periodic Reference Resetting (PRR) scheme that divides videos into short overlapping clips with dynamically updated reference frames to prevent error accumulation while maintaining temporal coherence, and a Hierarchical Tissue-aware Magnification (HTM) framework with dual-mode mask dilation. HTM first tracks vessel cores using a pretrained visual tracking model to maintain accurate localization despite occlusions and view changes. It then applies one of two adaptive softening strategies to surrounding tissues: motion-based softening that modulates magnification strength proportional to observed tissue displacement, or distance-based exponential decay that simulates biomechanical force attenuation. This dual-mode approach accommodates diverse surgical scenarios-motion-based softening excels with complex tissue deformations while distance-based softening provides stability during unreliable optical flow conditions. We evaluate EndoControlMag on our EndoVMM24 dataset spanning four different surgery types and various challenging scenarios, including occlusions, instrument disturbance, view changes, and vessel deformations. Quantitative metrics, visual assessments, and expert surgeon evaluations demonstrate that EndoControlMag significantly outperforms existing methods in both magnification accuracy and visual quality while maintaining robustness across challenging surgical conditions. The code, dataset, and video results are available at https://szupc.github.io/EndoControlMag/.
- Abstract(参考訳): 内視鏡下手術における血管運動の微妙な可視化は外科的精度と意思決定に不可欠であるが,手術シーンの複雑でダイナミックな性質のため,依然として困難である。
この問題を解決するために,内視鏡環境に合わせたマスク条件の血管運動拡大機能を備えたトレーニングフリーのラグランジアンベースのフレームワークであるEndoControlMagを紹介した。
提案手法では,時間的コヒーレンスを維持しながらエラーの蓄積を防止するために,動画を動的に更新された参照フレームでショートオーバーラップクリップに分割する,周期的参照リセット(PRR)方式と,デュアルモードマスクダイレーションを用いた階層的組織認識拡大(HTM)方式の2つの主要なモジュールを特徴とする。
HTMは、オクルージョンやビューの変更にもかかわらず正確なローカライゼーションを維持するために、事前訓練されたビジュアルトラッキングモデルを使用して、コンテナコアを追跡する。
次に、周囲の組織に適応的な軟化戦略の1つとして、観察された組織変位に比例した拡大強度を調節するモーションベース軟化法や、生体力学的力の減衰をシミュレートする距離ベース指数減衰法がある。
この二重モードアプローチは、複雑な組織変形を伴う運動に基づく軟化の多様な手術シナリオに対応し、一方距離ベースの軟化は信頼性の低い光流条件下で安定性を提供する。
本研究では,EndoVMM24データセット上のEndoControlMagの評価を行った。
定量的な測定、視覚的評価、および専門的な外科医の評価により、EndoControlMagは、挑戦的な手術条件をまたいだ堅牢性を維持しながら、拡大精度と視覚的品質の両方において既存の方法よりも有意に優れていたことが示されている。
コード、データセット、ビデオ結果はhttps://szupc.github.io/EndoControlMag/で公開されている。
関連論文リスト
- EndoVLA: Dual-Phase Vision-Language-Action Model for Autonomous Tracking in Endoscopy [26.132684811981143]
VLA(Vision-Language-Action)モデルは、視覚知覚、言語接地、モーションプランニングをエンドツーエンドのフレームワークに統合する。
EndoVLAは,(1)ポリープ追跡,(2)異常粘膜領域の脱線・追尾,(3)周囲切削時の円形マーカーへの付着の3つのコアタスクを実行する。
論文 参考訳(メタデータ) (2025-05-21T07:35:00Z) - X$^{2}$-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction [45.31051025401413]
X$2$-Gaussianは、連続4DCT再構成のための新しいフレームワークである。
動的放射スプラッティングと自己監督型呼吸運動学習を統合している。
従来の手法に比べて9.93dBのPSNR向上と2.25dBの改善を実現している。
論文 参考訳(メタデータ) (2025-03-27T17:59:57Z) - SurgSora: Object-Aware Diffusion Model for Controllable Surgical Video Generation [25.963369099780113]
SurgSoraは、単一の入力フレームとユーザが指定したモーションキューから、高忠実でモーションコントロール可能な手術用ビデオを生成するフレームワークである。
SurgSoraは、これらのリッチな機能を安定ビデオ拡散に組み込むことで、最先端の視覚的信頼性と制御性を達成する。
論文 参考訳(メタデータ) (2024-12-18T16:34:51Z) - Serp-Mamba: Advancing High-Resolution Retinal Vessel Segmentation with Selective State-Space Model [45.682311387979944]
本稿では,この課題に対処する最初のSerpentine Mamba(Serp-Mamba)ネットワークを提案する。
我々はまず,UWF-SLO画像をヘビのように曲がった血管構造に沿って走査するSerpentine Interwoven Adaptive (SIA)スキャン機構を考案した。
次に,高分解能画像によって強調されるカテゴリ不均衡問題に対処するアンビグニティ駆動型デュアルリカレーションモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-06T15:40:47Z) - PhysMamba: State Space Duality Model for Remote Physiological Measurement [18.423806804725032]
リモート光胸腺撮影(remote Photoplethysmography, RBFC)は、顔画像から非接触的な生理的信号の抽出を可能にする。
この研究は、リアルタイム遠隔医療を含む非接触型健康モニタリングの実践的応用の基盤となる。
論文 参考訳(メタデータ) (2024-08-02T07:52:28Z) - Efficient Multi-View Fusion and Flexible Adaptation to View Missing in Cardiovascular System Signals [4.519437028632205]
深層学習は、心臓血管系(CVS)信号に関する自動多視点融合(MVF)を促進する。
MVFモデルアーキテクチャは、しばしば同じ時間ステップからCVS信号と一致するが、統一された表現に異なる視点を持つ。
本稿では,事前学習したMVFモデルに対して,様々なシナリオに柔軟に対応するためのプロンプト手法を提案する。
論文 参考訳(メタデータ) (2024-06-13T08:58:59Z) - Real-time guidewire tracking and segmentation in intraoperative x-ray [52.51797358201872]
リアルタイムガイドワイヤ分割と追跡のための2段階のディープラーニングフレームワークを提案する。
第1段階では、ヨロフ5検出器が元のX線画像と合成画像を使って訓練され、ターゲットのガイドワイヤのバウンディングボックスを出力する。
第2段階では、検出された各バウンディングボックスにガイドワイヤを分割するために、新規で効率的なネットワークが提案されている。
論文 参考訳(メタデータ) (2024-04-12T20:39:19Z) - FLex: Joint Pose and Dynamic Radiance Fields Optimization for Stereo Endoscopic Videos [79.50191812646125]
内視鏡的シーンの再構築は、外科手術後の分析から教育訓練まで、様々な医療応用にとって重要な要素である。
変形組織の非常にダイナミックな環境下での移動内視鏡の挑戦的なセットアップに着目する。
複数重重なり合う4次元ニューラルラジアンスフィールド(NeRF)への暗黙的なシーン分離と、再構成とカメラのスクラッチからのポーズを協調的に最適化するプログレッシブ最適化手法を提案する。
これにより、使いやすさが向上し、5000フレーム以上の手術ビデオの処理に間に合うように復元能力を拡張できる。
論文 参考訳(メタデータ) (2024-03-18T19:13:02Z) - Deep Cardiac MRI Reconstruction with ADMM [7.694990352622926]
心臓画像の分野では, 深層学習(DL)を用いたシネ・マルチコントラスト再建法を提案する。
提案手法は画像領域とk空間領域の両方を最適化し,高い再構成精度を実現する。
論文 参考訳(メタデータ) (2023-10-10T13:46:11Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - FetReg: Placental Vessel Segmentation and Registration in Fetoscopy
Challenge Dataset [57.30136148318641]
Fetoscopy Laser Photocoagulation はツイン・ツー・ツイン・トランスフュージョン症候群(TTTS)の治療に広く用いられている治療法である
これにより、プロシージャ時間と不完全アブレーションが増加し、持続的なTTTSが生じる可能性がある。
コンピュータ支援による介入は、ビデオモザイクによって胎児の視野を広げ、船体ネットワークのより良い視覚化を提供することによって、これらの課題を克服するのに役立つかもしれない。
本稿では,長期フェトスコープビデオからドリフトフリーモザイクを作成することを目的とした,胎児環境のための汎用的でロバストなセマンティックセマンティックセグメンテーションとビデオモザイクアルゴリズムを開発するための大規模マルチセントデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:14:27Z) - Dueling Deep Q-Network for Unsupervised Inter-frame Eye Movement
Correction in Optical Coherence Tomography Volumes [5.371290280449071]
オプティカルコヒーレンス・トモグラフィー(OCT)では、個々のスライスを連続的に取得することで、運動アーティファクトにこのモダリティが生じる。
この画像モダリティの特徴であるスペックルノイズは、従来の登録技術が採用されている際に不正確となる。
本稿では、深層強化学習を用いて、フレーム間の動きを教師なしで補正することで、これらの課題に対処する。
論文 参考訳(メタデータ) (2020-07-03T07:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。