論文の概要: Optimizing Latent Graph Representations of Surgical Scenes for Zero-Shot
Domain Transfer
- arxiv url: http://arxiv.org/abs/2403.06953v1
- Date: Mon, 11 Mar 2024 17:36:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 17:44:24.496733
- Title: Optimizing Latent Graph Representations of Surgical Scenes for Zero-Shot
Domain Transfer
- Title(参考訳): ゼロショットドメイン転送のための手術シーンの潜在グラフ表現の最適化
- Authors: Siddhant Satyanaik, Aditya Murali, Deepak Alapatt, Xin Wang, Pietro
Mascagni, Nicolas Padoy
- Abstract要約: ドメイン一般化のための4つのオブジェクト中心のアプローチを評価し、ベースライン性能を確立する。
本稿では, 領域一般化のための最適化手法LG-DGを開発した。
最適化されたLG-DGは、最高のベースラインアプローチよりも9.28%向上した。
- 参考スコア(独自算出の注目度): 6.880129372917993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Purpose: Advances in deep learning have resulted in effective models for
surgical video analysis; however, these models often fail to generalize across
medical centers due to domain shift caused by variations in surgical workflow,
camera setups, and patient demographics. Recently, object-centric learning has
emerged as a promising approach for improved surgical scene understanding,
capturing and disentangling visual and semantic properties of surgical tools
and anatomy to improve downstream task performance. In this work, we conduct a
multi-centric performance benchmark of object-centric approaches, focusing on
Critical View of Safety assessment in laparoscopic cholecystectomy, then
propose an improved approach for unseen domain generalization.
Methods: We evaluate four object-centric approaches for domain
generalization, establishing baseline performance. Next, leveraging the
disentangled nature of object-centric representations, we dissect one of these
methods through a series of ablations (e.g. ignoring either visual or semantic
features for downstream classification). Finally, based on the results of these
ablations, we develop an optimized method specifically tailored for domain
generalization, LG-DG, that includes a novel disentanglement loss function.
Results: Our optimized approach, LG-DG, achieves an improvement of 9.28% over
the best baseline approach. More broadly, we show that object-centric
approaches are highly effective for domain generalization thanks to their
modular approach to representation learning.
Conclusion: We investigate the use of object-centric methods for unseen
domain generalization, identify method-agnostic factors critical for
performance, and present an optimized approach that substantially outperforms
existing methods.
- Abstract(参考訳): 目的: 深層学習の進歩は, 手術映像解析の有効なモデルとなったが, 外科的ワークフロー, カメラ設定, 患者人口の変動による領域シフトにより, 医療センター全体の一般化に失敗することが多い。
近年,下流の作業性能を向上させるために,手術ツールや解剖学の視覚的・意味的特性の理解・把握・解消に期待できるアプローチとして,オブジェクト指向学習が登場している。
本研究では, 腹腔鏡下胆嚢摘出術における安全性評価のクリティカルビューに着目し, 対象中心アプローチの多点評価ベンチマークを行い, 未確認領域の一般化のための改良アプローチを提案する。
メソッド: ドメイン一般化のための4つのオブジェクト中心のアプローチを評価し, ベースライン性能を確立する。
次に,オブジェクト中心表現の不連続性を生かして,一連のアブレーション(例えば,下流分類の視覚的特徴や意味的特徴を無視する)を通して,これらの手法の1つを分離する。
最後に, これらのアブレーションの結果に基づいて, ドメイン一般化のための最適化手法lg-dgを開発した。
結果: 最適化されたLG-DGは, 最高のベースラインアプローチよりも9.28%向上した。
より広範に、表現学習に対するモジュラーアプローチのおかげで、オブジェクト指向アプローチはドメインの一般化に非常に効果的であることを示す。
結論: ドメインの一般化にオブジェクト中心の手法を用いることについて検討し, 性能に重要な手法に依存しない因子を同定し, 既存の手法を著しく上回る最適化手法を提案する。
関連論文リスト
- Pruning the Path to Optimal Care: Identifying Systematically Suboptimal Medical Decision-Making with Inverse Reinforcement Learning [14.688842697886484]
本稿では, 同僚の行動に基づいて, 最適な臨床行為を識別する逆強化学習の新たな応用法を提案する。
このアプローチはIRLの2つの段階を中心とし、コンセンサスから大きく逸脱する行動を示す軌跡をプーンする中間段階を持つ。
論文 参考訳(メタデータ) (2024-11-07T23:16:59Z) - GS-EMA: Integrating Gradient Surgery Exponential Moving Average with
Boundary-Aware Contrastive Learning for Enhanced Domain Generalization in
Aneurysm Segmentation [41.97669338211682]
勾配手術指数移動平均(GS-EMA)最適化手法と境界対応コントラスト学習(BACL)を利用した新しい領域一般化戦略を提案する。
我々のアプローチは、ドメイン不変の特徴を学習することで、新しい未確認領域に適応し、様々な臨床データセット間での動脈瘤セグメンテーションの堅牢性と正確性を向上させることができるという点で際立っている。
論文 参考訳(メタデータ) (2024-02-23T10:02:15Z) - Hypergraph-Transformer (HGT) for Interactive Event Prediction in
Laparoscopic and Robotic Surgery [50.3022015601057]
腹腔内ビデオから外科的ワークフローの重要なインタラクティブな側面を理解し,予測できる予測型ニューラルネットワークを提案する。
我々は,既存の手術用データセットとアプリケーションに対するアプローチを検証し,アクション・トリプレットの検出と予測を行った。
この結果は、非構造的な代替案と比較して、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2024-02-03T00:58:05Z) - Optimizing $CO_{2}$ Capture in Pressure Swing Adsorption Units: A Deep
Neural Network Approach with Optimality Evaluation and Operating Maps for
Decision-Making [0.0]
本研究は,二酸化炭素捕捉用加圧湿式吸着ユニットの高機能化に焦点をあてる。
2つのディープニューラルネットワーク(DNN)モデルからなるマルチインプット・シングルアウトプット(MISO)フレームワークを開発し,実装した。
このアプローチは、実行可能な運用領域(FOR)を明確にし、最適な意思決定シナリオのスペクトルを強調した。
論文 参考訳(メタデータ) (2023-12-06T19:43:37Z) - Exploring the Optimization Objective of One-Class Classification for
Anomaly Detection [2.9266769103356305]
一級分類(英: One-class classification, OCC)は、異常検出の長年の方法である。
本研究では,OCCの最適化目標について徹底的に検討する。
適切なノルムを持つ任意の空間は、超球中心の代用として機能する。
この新たな洞察は、単純でデータに依存しないディープワンクラス分類法に火をつけている。
論文 参考訳(メタデータ) (2023-08-23T03:46:04Z) - Data Augmentation-Based Unsupervised Domain Adaptation In Medical
Imaging [0.709016563801433]
脳MRI領域分割における堅牢な領域適応のための教師なし手法を提案する。
その結果,提案手法は高い精度を実現し,幅広い適用性を示し,各種タスクにおけるドメインシフトに対する顕著な堅牢性を示した。
論文 参考訳(メタデータ) (2023-08-08T17:00:11Z) - Taxonomy Adaptive Cross-Domain Adaptation in Medical Imaging via
Optimization Trajectory Distillation [73.83178465971552]
自動医用画像解析の成功は、大規模かつ専門家による注釈付きトレーニングセットに依存する。
非教師なしドメイン適応(UDA)はラベル付きデータ収集の負担を軽減するための有望なアプローチである。
本稿では,2つの技術的課題に新しい視点から対処する統一的手法である最適化トラジェクトリ蒸留を提案する。
論文 参考訳(メタデータ) (2023-07-27T08:58:05Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - Shape-aware Meta-learning for Generalizing Prostate MRI Segmentation to
Unseen Domains [68.73614619875814]
前立腺MRIのセグメント化におけるモデル一般化を改善するために,新しい形状認識メタラーニング手法を提案する。
実験結果から,本手法は未確認領域の6つの設定すべてにおいて,最先端の一般化手法を一貫して上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2020-07-04T07:56:02Z) - Automatic Data Augmentation via Deep Reinforcement Learning for
Effective Kidney Tumor Segmentation [57.78765460295249]
医用画像セグメンテーションのための新しい学習ベースデータ拡張法を開発した。
本手法では,データ拡張モジュールと後続のセグメンテーションモジュールをエンドツーエンドのトレーニング方法で一貫した損失と,革新的に組み合わせる。
提案法の有効性を検証したCT腎腫瘍分節法について,本法を広範囲に評価した。
論文 参考訳(メタデータ) (2020-02-22T14:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。