論文の概要: MedVSR: Medical Video Super-Resolution with Cross State-Space Propagation
- arxiv url: http://arxiv.org/abs/2509.21265v1
- Date: Thu, 25 Sep 2025 14:56:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:13.002615
- Title: MedVSR: Medical Video Super-Resolution with Cross State-Space Propagation
- Title(参考訳): MedVSR:医療ビデオのスーパーリゾリューションとクロスステートスペースのプロパゲーション
- Authors: Xinyu Liu, Guolei Sun, Cheng Wang, Yixuan Yuan, Ender Konukoglu,
- Abstract要約: 低解像度(LR)医療ビデオは、ビデオ超解像度(VSR)モデルに固有の課題を提示する。
本稿では,医療用VSRのためのフレームワークであるMedVSRを提案する。
MedVSRは既存のVSRモデルよりも性能と効率が優れていることを示す。
- 参考スコア(独自算出の注目度): 63.38824041721275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-resolution (HR) medical videos are vital for accurate diagnosis, yet are hard to acquire due to hardware limitations and physiological constraints. Clinically, the collected low-resolution (LR) medical videos present unique challenges for video super-resolution (VSR) models, including camera shake, noise, and abrupt frame transitions, which result in significant optical flow errors and alignment difficulties. Additionally, tissues and organs exhibit continuous and nuanced structures, but current VSR models are prone to introducing artifacts and distorted features that can mislead doctors. To this end, we propose MedVSR, a tailored framework for medical VSR. It first employs Cross State-Space Propagation (CSSP) to address the imprecise alignment by projecting distant frames as control matrices within state-space models, enabling the selective propagation of consistent and informative features to neighboring frames for effective alignment. Moreover, we design an Inner State-Space Reconstruction (ISSR) module that enhances tissue structures and reduces artifacts with joint long-range spatial feature learning and large-kernel short-range information aggregation. Experiments across four datasets in diverse medical scenarios, including endoscopy and cataract surgeries, show that MedVSR significantly outperforms existing VSR models in reconstruction performance and efficiency. Code released at https://github.com/CUHK-AIM-Group/MedVSR.
- Abstract(参考訳): 高解像度(HR)医療ビデオは正確な診断には不可欠であるが、ハードウェアの限界と生理的制約のため取得は困難である。
臨床的には、収集された低解像度(LR)医療ビデオは、カメラの揺らぎ、ノイズ、突然のフレーム遷移など、ビデオ超高解像度(VSR)モデルに固有の課題を示し、光学的フローエラーとアライメントの困難をもたらす。
さらに、組織や臓器は連続的かつニュアンスのある構造を示すが、現在のVSRモデルは、医師を誤解させるような人工物や歪んだ特徴を導入する傾向にある。
この目的のために,医療用VSRに適したフレームワークであるMedVSRを提案する。
まず、クロスステート空間伝搬(CSSP)を用いて、近距離フレームを状態空間モデル内の制御行列として投影し、隣接するフレームに一貫性のある情報的特徴を選択的に伝播して効果的なアライメントを実現する。
さらに, 組織構造を向上し, 関節長範囲空間特徴学習と大カーネル短距離情報集約によるアーティファクトを低減する内的状態空間再構成(ISSR)モジュールを設計する。
内視鏡検査や白内障手術を含む様々な医療シナリオにおける4つのデータセットにわたる実験は、MedVSRが既存のVSRモデルより大幅に優れており、再現性能と効率が向上していることを示している。
https://github.com/CUHK-AIM-Group/MedVSRで公開されている。
関連論文リスト
- HRVVS: A High-resolution Video Vasculature Segmentation Network via Hierarchical Autoregressive Residual Priors [18.951871257229055]
本稿では,35本の肝切除ビデオと11442本の高分解能フレームを含む,高品質なフレーム・バイ・フレームアノテート肝血管データセットを提案する。
本稿では,HRVVSと呼ばれる新しい高分解能ビデオ血管セグメンテーションネットワークを提案する。
提案するHRVVSは最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2025-07-30T09:57:38Z) - FaRMamba: Frequency-based learning and Reconstruction aided Mamba for Medical Segmentation [3.5790602918760586]
Vision Mambaは、グローバルな依存関係を効率的にモデル化するために、一次元の因果状態空間の再現を用いる。
パッチトークン化と1Dシリアライゼーションは、局所的なピクセル隣接性を阻害し、ローパスフィルタリング効果を課す。
2つの相補的なモジュールを通してLHICDと2D-SSDを明示的に扱う新しい拡張であるFaRMambaを提案する。
論文 参考訳(メタデータ) (2025-07-26T20:41:53Z) - UltraVSR: Achieving Ultra-Realistic Video Super-Resolution with Efficient One-Step Diffusion Space [46.43409853027655]
拡散モデルは、現実的な画像の詳細を生成する大きな可能性を示している。
これらのモデルをビデオ超解像(VSR)に適応させることは、その性質と時間的モデリングの欠如により、依然として困難である。
我々は,超現実的で時間的に整合したVSRを,効率的なワンステップ拡散空間で実現するための新しいフレームワークであるUltraVSRを提案する。
論文 参考訳(メタデータ) (2025-05-26T13:19:27Z) - Decoupling Multi-Contrast Super-Resolution: Pairing Unpaired Synthesis with Implicit Representations [6.255537948555454]
マルチコントラスト・スーパーリゾリューション技術は、低解像度のコントラストの品質を高めることができる。
既存のMCSRメソッドは、しばしば固定解像度の設定を前提としており、すべて大きな完全にペアのトレーニングデータセットを必要とする。
本稿では,ペア化トレーニングデータの必要性を排除し,任意のアップスケーリングをサポートするモジュール型マルチコントラスト超解法フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-09T07:48:52Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - FLex: Joint Pose and Dynamic Radiance Fields Optimization for Stereo Endoscopic Videos [79.50191812646125]
内視鏡的シーンの再構築は、外科手術後の分析から教育訓練まで、様々な医療応用にとって重要な要素である。
変形組織の非常にダイナミックな環境下での移動内視鏡の挑戦的なセットアップに着目する。
複数重重なり合う4次元ニューラルラジアンスフィールド(NeRF)への暗黙的なシーン分離と、再構成とカメラのスクラッチからのポーズを協調的に最適化するプログレッシブ最適化手法を提案する。
これにより、使いやすさが向上し、5000フレーム以上の手術ビデオの処理に間に合うように復元能力を拡張できる。
論文 参考訳(メタデータ) (2024-03-18T19:13:02Z) - K-Space-Aware Cross-Modality Score for Synthesized Neuroimage Quality
Assessment [71.27193056354741]
クロスモダリティな医用画像合成をどう評価するかという問題は、ほとんど解明されていない。
本稿では,この課題の進展を促すため,新しい指標K-CROSSを提案する。
K-CROSSは、トレーニング済みのマルチモードセグメンテーションネットワークを使用して、病変の位置を予測する。
論文 参考訳(メタデータ) (2023-07-10T01:26:48Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。