論文の概要: Deep-Learning-Assisted Analysis of Cataract Surgery Videos
- arxiv url: http://arxiv.org/abs/2312.05900v1
- Date: Sun, 10 Dec 2023 14:25:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 18:02:24.512265
- Title: Deep-Learning-Assisted Analysis of Cataract Surgery Videos
- Title(参考訳): ディープラーニングを用いた白内障手術ビデオの解析
- Authors: Negin Ghamsarian
- Abstract要約: このような自動システムの需要が絶え間なく増加し、外科的ビデオ分析のための機械学習ベースのアプローチがもたらされた。
この論文は、白内障手術ビデオ解析における重要な課題に対処し、効率的な文脈認識システム構築の道を開く。
- 参考スコア(独自算出の注目度): 1.8673970128645236
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Following the technological advancements in medicine, the operation rooms are
evolving into intelligent environments. The context-aware systems (CAS) can
comprehensively interpret the surgical state, enable real-time warning, and
support decision-making, especially for novice surgeons. These systems can
automatically analyze surgical videos and perform indexing, documentation, and
post-operative report generation. The ever-increasing demand for such automatic
systems has sparked machine-learning-based approaches for surgical video
analysis. This thesis addresses the significant challenges in cataract surgery
video analysis to pave the way for building efficient context-aware systems.
The main contributions of this thesis are five folds: (1) This thesis
demonstrates that spatio-temporal localization of the relevant content can
considerably improve phase recognition accuracy. (2) This thesis proposes a
novel deep-learning-based framework for relevance-based compression to enable
real-time streaming and adaptive storage of cataract surgery videos. (3)
Several convolutional modules are proposed to boost the networks' semantic
interpretation performance in challenging conditions. These challenges include
blur and reflection distortion, transparency, deformability, color and texture
variation, blunt edges, and scale variation. (4) This thesis proposes and
evaluates the first framework for automatic irregularity detection in cataract
surgery videos. (5) To alleviate the requirement for manual pixel-based
annotations, this thesis proposes novel strategies for self-supervised
representation learning adapted to semantic segmentation.
- Abstract(参考訳): 医療技術の進歩に伴い、手術室はインテリジェントな環境へと進化している。
文脈認識システム(CAS)は、手術状態を包括的に解釈し、リアルタイム警告を可能にし、特に初心者外科医の意思決定を支援する。
これらのシステムは、手術ビデオを自動的に分析し、インデクシング、文書化、手術後のレポート生成を行うことができる。
このような自動システムに対する需要がますます高まる中、手術用ビデオ分析のための機械学習ベースのアプローチが生まれている。
この論文は白内障手術ビデオ解析における重要な課題に対処し、効率的な文脈認識システム構築の道を開く。
1) 本論文は, 関連コンテンツの時空間的局所化が位相認識精度を大幅に向上させることを示す。
2)本論文は,白内障手術ビデオのリアルタイムストリーミングと適応ストレージを実現するための,関連性に基づく圧縮のための新しいディープラーニングフレームワークを提案する。
3)いくつかの畳み込みモジュールが提案され,ネットワークの意味解釈性能の向上が期待できる。
これらの課題には、ぼかしと反射の歪み、透明性、変形性、色とテクスチャの変化、鈍いエッジ、スケールの変動などがある。
(4)白内障手術ビデオにおける自動不規則検出のための最初の枠組みを提案し,評価する。
(5)手動ピクセルベースのアノテーションの要件を軽減するため,セマンティックセグメンテーションに適応した自己教師付き表現学習のための新しい戦略を提案する。
関連論文リスト
- Learning Multi-modal Representations by Watching Hundreds of Surgical
Video Lectures [54.376834698110684]
本研究では,オープンな外科的eラーニングプラットフォームを通じて利用可能な手術ビデオ講義が,効果的な監視信号を提供することができるという考えを提起した。
我々は複数の補完的な自動音声認識システムを用いてテキストの書き起こしを生成する。
次に、多モーダル表現学習のための新しい方法、Surg - Surgery Vision Language Pre-trainingを提案する。
論文 参考訳(メタデータ) (2023-07-27T22:38:12Z) - Neural LerPlane Representations for Fast 4D Reconstruction of Deformable
Tissues [52.886545681833596]
LerPlaneは単一視点環境下での手術シーンの高速かつ正確な再構築手法である。
LerPlaneは外科手術を4Dボリュームとして扱い、静的および動的フィールドの明示的な2D平面に分解する。
LerPlaneは静的フィールドを共有し、動的組織モデリングのワークロードを大幅に削減する。
論文 参考訳(メタデータ) (2023-05-31T14:38:35Z) - Learning How To Robustly Estimate Camera Pose in Endoscopic Videos [5.073761189475753]
カメラポーズ推定における2つの幾何学的損失を最小限に抑えるために,奥行きと光学的流れを推定するステレオ内視鏡の解を提案する。
最も重要なことは、入力画像の内容に応じてコントリビューションのバランスをとるために、2つの学習された画素単位の重みマッピングを導入することである。
パブリックなSCAREDデータセットに対する我々のアプローチを検証するとともに、新たなインビボデータセットであるStereoMISを導入しています。
論文 参考訳(メタデータ) (2023-04-17T07:05:01Z) - Robotic Navigation Autonomy for Subretinal Injection via Intelligent
Real-Time Virtual iOCT Volume Slicing [88.99939660183881]
網膜下注射のための自律型ロボットナビゲーションの枠組みを提案する。
提案手法は,機器のポーズ推定方法,ロボットとi OCTシステム間のオンライン登録,およびインジェクションターゲットへのナビゲーションに適した軌道計画から構成される。
ブタ前眼の精度と再現性について実験を行った。
論文 参考訳(メタデータ) (2023-01-17T21:41:21Z) - Learning-Based Keypoint Registration for Fetoscopic Mosaicking [65.02392513942533]
ツイン・トゥ・ツイン輸血症候群(TTTS)では、単子葉胎盤の血管系異常な血管性無痛が両胎児の間に不均一な血流を生じさせる。
本研究では,フィールド・オブ・ビュー展開のためのフェトスコープフレーム登録のための学習ベースフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T21:21:12Z) - A Temporal Learning Approach to Inpainting Endoscopic Specularities and
Its effect on Image Correspondence [13.25903945009516]
本稿では,時間的生成的対位ネットワーク(GAN)を用いて,隠蔽解剖学を特異性の下で描くことを提案する。
これは、胃内視鏡(Hyper-Kvasir)の生検データを用いて、完全に教師なしの方法で達成される。
また,3次元再構成とカメラモーション推定の基盤となるコンピュータビジョンタスクにおける本手法の有効性を評価する。
論文 参考訳(メタデータ) (2022-03-31T13:14:00Z) - Relevance Detection in Cataract Surgery Videos by Spatio-Temporal Action
Localization [7.235239641693831]
白内障手術では、顕微鏡の助けを借りて手術を行います。
顕微鏡は最大2人程度でリアルタイム手術を観察できるため、記録されたビデオを用いて手術訓練の大部分を行う。
ビデオコンテンツでトレーニング手順を最適化するには、外科医は自動関連性検出アプローチが必要です。
本稿では,白内障映像における関連フェーズセグメントの検出と分類を行うための3モジュールフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-29T12:01:08Z) - Simulation-to-Real domain adaptation with teacher-student learning for
endoscopic instrument segmentation [1.1047993346634768]
注釈付きシミュレーションデータとラベルのない実データから共同学習する教師学習手法を紹介します。
3つのデータセットの実証結果は、提案したフレームワークの有効性を浮き彫りにする。
論文 参考訳(メタデータ) (2021-03-02T09:30:28Z) - Relational Graph Learning on Visual and Kinematics Embeddings for
Accurate Gesture Recognition in Robotic Surgery [84.73764603474413]
本稿では,マルチモーダルグラフネットワーク(MRG-Net)の新たなオンラインアプローチを提案し,視覚情報とキネマティクス情報を動的に統合する。
本手法の有効性は, JIGSAWSデータセット上での最先端の成果で実証された。
論文 参考訳(メタデータ) (2020-11-03T11:00:10Z) - Synthetic and Real Inputs for Tool Segmentation in Robotic Surgery [10.562627972607892]
腹腔鏡画像と組み合わせたロボットキネマティックデータを用いてラベル付け問題を緩和できる可能性が示唆された。
腹腔鏡画像とシミュレーション画像の並列処理のための新しい深層学習モデルを提案する。
論文 参考訳(メタデータ) (2020-07-17T16:33:33Z) - LRTD: Long-Range Temporal Dependency based Active Learning for Surgical
Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。
具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。
手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-21T09:21:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。