論文の概要: PhySe-RPO: Physics and Semantics Guided Relative Policy Optimization for Diffusion-Based Surgical Smoke Removal
- arxiv url: http://arxiv.org/abs/2603.22844v2
- Date: Wed, 25 Mar 2026 11:20:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 14:25:25.996353
- Title: PhySe-RPO: Physics and Semantics Guided Relative Policy Optimization for Diffusion-Based Surgical Smoke Removal
- Title(参考訳): PhySe-RPO: 拡散型手術煙除去のための相対的政策最適化に関する物理・セマンティックス
- Authors: Zining Fang, Chunhui Liu, Bin Xu, Ming Chen, Xiaowei Hu, Cheng Xue,
- Abstract要約: 外科的煙は、術中ビデオ品質を著しく低下させ、解剖学的構造を覆い、外科的知覚を制限する。
我々はPhySe-RPOを提案する。PhySe-RPOは物理およびセマンティックス誘導相対ポリシー最適化によって最適化された拡散復元フレームワークである。
物理学誘導報酬は照明と色の一貫性を課し、CLIPに基づく外科的概念から学んだ視覚概念のセマンティック報酬は無煙で解剖学的に一貫性のある修復を促進する。
- 参考スコア(独自算出の注目度): 11.399795585157863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Surgical smoke severely degrades intraoperative video quality, obscuring anatomical structures and limiting surgical perception. Existing learning-based desmoking approaches rely on scarce paired supervision and deterministic restoration pipelines, making it difficult to perform exploration or reinforcement-driven refinement under real surgical conditions. We propose PhySe-RPO, a diffusion restoration framework optimized through Physics- and Semantics-Guided Relative Policy Optimization. The core idea is to transform deterministic restoration into a stochastic policy, enabling trajectory-level exploration and critic-free updates via group-relative optimization. A physics-guided reward imposes illumination and color consistency, while a visual-concept semantic reward learned from CLIP-based surgical concepts promotes smoke-free and anatomically coherent restoration. Together with a reference-free perceptual constraint, PhySe-RPO produces results that are physically consistent, semantically faithful, and clinically interpretable across synthetic and real robotic surgical datasets, providing a principled route to robust diffusion-based restoration under limited paired supervision.
- Abstract(参考訳): 外科的煙は、術中ビデオ品質を著しく低下させ、解剖学的構造を覆い、外科的知覚を制限する。
既存の学習に基づく禁煙アプローチは、少ないペアの監督と決定論的修復パイプラインに依存しており、実際の外科的条件下での探索や強化駆動的な改善を困難にしている。
本稿では,PhySe-RPO(PhySe-RPO)を提案する。
中心となる考え方は、決定論的復元を確率的ポリシーに転換し、軌道レベルの探索とグループ相対最適化による批判のない更新を可能にすることである。
物理学誘導報酬は照明と色の一貫性を課し、CLIPに基づく外科的概念から学んだ視覚概念のセマンティック報酬は無煙で解剖学的に一貫性のある修復を促進する。
基準のない知覚的制約とともに、PhySe-RPOは、物理的に一貫性があり、意味論的に忠実であり、人工的および実際のロボット外科的データセット間で臨床的に解釈可能な結果を生成し、限定されたペアの監督の下で、堅牢な拡散ベースの回復への原則的な経路を提供する。
関連論文リスト
- Investigating a Policy-Based Formulation for Endoscopic Camera Pose Recovery [13.321458523588626]
視覚に基づくナビゲーションシステムは、内視鏡的ビデオから直接カメラのポーズを復元することで、内視鏡的手術を再現しようとしている。
ほとんどのアプローチは、外科医を成功させる新しいフレームについて推論するのと同じ原則を具現化していない。
本研究では,前回のカメラ状態に条件付き軌跡を推定する専門家を模倣した,内視鏡的ポーズ回復のポリシーに基づく定式化を提案する。
論文 参考訳(メタデータ) (2026-03-20T15:30:59Z) - Percept-Aware Surgical Planning for Visual Cortical Prostheses with Vascular Avoidance [6.649753747542209]
初期視覚野における電気刺激ニューロンによる視力回復を目的とした皮質視覚補綴(V1)
既存の戦略は視野のカバレッジと解剖学を重視しているが、安全制約の下で予測された知覚結果を直接最適化するものではない。
解剖学的空間における電極配置を制約付き最適化問題として定式化した皮質視覚補綴の外科的計画のための知覚型枠組みを提案する。
論文 参考訳(メタデータ) (2026-02-27T22:59:18Z) - Bidirectional Reward-Guided Diffusion for Real-World Image Super-Resolution [79.35296000454694]
拡散に基づく超解像は、豊富な詳細を合成することができるが、合成ペアデータで訓練されたモデルは、現実世界のLR画像では失敗することが多い。
我々は,超解像を軌道レベルの優先最適化として定式化する報奨誘導拡散フレームワークであるBird-SRを提案する。
実世界のSRベンチマークの実験では、Bird-SRは知覚品質において最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-05T19:21:45Z) - A Koopman-Bayesian Framework for High-Fidelity, Perceptually Optimized Haptic Surgical Simulation [0.0]
本稿では, 非線形力学, 知覚心理学, 高周波触覚レンダリングを併用し, 手術シミュレーションにおけるリアリズムを向上する統合フレームワークを提案する。
また, 触診, 切開, 骨削りなどの外科的作業のシミュレーションでは, 平均レンダリング遅延が4.3ms, 力誤差が2.8%未満, 知覚的識別が20%向上した。
論文 参考訳(メタデータ) (2026-01-04T20:43:37Z) - Moving Beyond Diffusion: Hierarchy-to-Hierarchy Autoregression for fMRI-to-Image Reconstruction [65.67001243986981]
我々は,スケールワイド自己回帰モデルに基づく粗大なfMRI画像再構成フレームワークであるMindHierを提案する。
MindHierは、拡散ベースのベースラインよりも優れたセマンティック忠実さ、4.67倍高速な推論、より決定論的結果を達成する。
論文 参考訳(メタデータ) (2025-10-25T15:40:07Z) - EndoUFM: Utilizing Foundation Models for Monocular depth estimation of endoscopic images [7.350425834778092]
EndoUFMは、教師なしの単眼深度推定フレームワークである。
強力な事前学習先を活用することにより、深さ推定性能を向上させる。
この研究は、最小侵襲の手術において、外科医の空間的知覚を増大させるのに寄与する。
論文 参考訳(メタデータ) (2025-08-25T11:33:05Z) - Benchmarking Laparoscopic Surgical Image Restoration and Beyond [54.28852320829451]
腹腔鏡下手術では、明瞭で高品質な視野が外科医の正確な判断に不可欠である。
持続的な視覚劣化、例えば、エネルギー装置によって発生する煙、熱勾配から光るレンズ、およびレンズ汚染は患者の安全に危険をもたらす。
本稿では,SurgCleanと呼ばれる腹腔鏡下環境を対象とするオープンソースの手術画像復元データセットについて紹介する。
論文 参考訳(メタデータ) (2025-05-25T14:17:56Z) - RSFR: A Coarse-to-Fine Reconstruction Framework for Diffusion Tensor Cardiac MRI with Semantic-Aware Refinement [10.620138922340258]
心拡散強調画像再構成のための新しいフレームワークであるRSFR(Reconstruction, Fusion & Refinement)を紹介する。
RSFRは、Segment Anything ModelとロバストなVision Mambaベースの再構築バックボーンを通じてゼロショットセマンティクスを活用、粗大な戦略を採用している。
提案フレームワークは,アーティファクトを効果的に緩和し,忠実度を高めるために意味的特徴を統合し,最先端の復元品質と高精度DTパラメータ推定を実現する。
論文 参考訳(メタデータ) (2025-04-25T17:41:14Z) - Safe Deep RL for Intraoperative Planning of Pedicle Screw Placement [61.28459114068828]
安全な深部強化学習(DRL)に基づく訓練経路計画にリアルタイムな観察を活用するロボット脊椎手術の術中計画手法を提案する。
本手法は,ゴールドスタンダード (GS) 掘削計画に関して,90%の骨貫通を達成できた。
論文 参考訳(メタデータ) (2023-05-09T11:42:53Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。