論文の概要: Self-distillation for surgical action recognition
- arxiv url: http://arxiv.org/abs/2303.12915v1
- Date: Wed, 22 Mar 2023 21:09:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 16:29:02.838793
- Title: Self-distillation for surgical action recognition
- Title(参考訳): 手術動作認識のための自己蒸留
- Authors: Amine Yamlahi, Thuy Nuong Tran, Patrick Godau, Melanie Schellenberg,
Dominik Michael, Finn-Henri Smidt, Jan-Hinrich Noelke, Tim Adler, Minu
Dietlinde Tizabi, Chinedu Nwoye, Nicolas Padoy, Lena Maier-Hein
- Abstract要約: 外科的ビデオ解析におけるクラス不均衡と潜在的なラベル曖昧性に対処する手段として,自己蒸留の概念を検討する。
提案手法は,スウィントランスフォーマーをバックボーンとして用いる3種類のモデルの異種アンサンブルである。
本手法は, 医用画像解析アプリケーションにおいて, 自己蒸留が重要なツールとなる可能性を示している。
- 参考スコア(独自算出の注目度): 1.9217607824148526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surgical scene understanding is a key prerequisite for contextaware decision
support in the operating room. While deep learning-based approaches have
already reached or even surpassed human performance in various fields, the task
of surgical action recognition remains a major challenge. With this
contribution, we are the first to investigate the concept of self-distillation
as a means of addressing class imbalance and potential label ambiguity in
surgical video analysis. Our proposed method is a heterogeneous ensemble of
three models that use Swin Transfomers as backbone and the concepts of
self-distillation and multi-task learning as core design choices. According to
ablation studies performed with the CholecT45 challenge data via
cross-validation, the biggest performance boost is achieved by the usage of
soft labels obtained by self-distillation. External validation of our method on
an independent test set was achieved by providing a Docker container of our
inference model to the challenge organizers. According to their analysis, our
method outperforms all other solutions submitted to the latest challenge in the
field. Our approach thus shows the potential of self-distillation for becoming
an important tool in medical image analysis applications.
- Abstract(参考訳): 手術現場理解は手術室における文脈認識意思決定支援の重要な前提条件である。
深層学習に基づくアプローチはすでに様々な分野で人間のパフォーマンスを上回っているが、手術行動認識の課題は依然として大きな課題である。
この貢献により, 手術ビデオ解析におけるクラス不均衡と潜在的なラベル曖昧性に対処する手段として, 自己蒸留の概念を初めて検討した。
提案手法は,スウィントランスフォマーをバックボーンとして,自己蒸留とマルチタスク学習を基本設計として用いる3つのモデルからなる不均質アンサンブルである。
クロスバリデーションによるColecT45チャレンジデータを用いたアブレーション研究によると, 自己蒸留により得られたソフトラベルを用いることで, 最大の性能向上が達成された。
独立したテストセット上でのメソッドの外部検証は、当社の推論モデルのDockerコンテナをチャレンジオーガナイザに提供することで実現しました。
彼らの分析によると、本手法は、この分野における最新の課題に対する他のソリューションよりも優れている。
本手法は, 医用画像解析における重要なツールとなるための自己蒸留の可能性を示す。
関連論文リスト
- Jumpstarting Surgical Computer Vision [2.7396997668655163]
我々は、多様な外科的データセットを柔軟に活用するために、自己教師付き学習を採用する。
腹腔鏡下胆嚢摘出術と腹腔鏡下子宮摘出術の位相認識と安全性の検討を行った。
事前トレーニングデータセットの構成は、さまざまな下流タスクに対するSSLメソッドの有効性に大きな影響を与える可能性がある。
論文 参考訳(メタデータ) (2023-12-10T18:54:16Z) - Adaptive Semi-Supervised Segmentation of Brain Vessels with Ambiguous
Labels [63.415444378608214]
提案手法は, 進歩的半教師付き学習, 適応的学習戦略, 境界拡張など, 革新的な手法を取り入れたものである。
3DRAデータセットによる実験結果から,メッシュベースのセグメンテーション指標を用いて,本手法の優位性を示す。
論文 参考訳(メタデータ) (2023-08-07T14:16:52Z) - Validating polyp and instrument segmentation methods in colonoscopy through Medico 2020 and MedAI 2021 Challenges [58.32937972322058]
メディコオートマチックポリープセグメンテーション(Medico 2020)と「メディコ:医療画像の透明性(MedAI 2021)」コンペティション。
本報告では, それぞれのコントリビューションを包括的に分析し, ベストパフォーマンスメソッドの強さを強調し, クリニックへの臨床翻訳の可能性について考察する。
論文 参考訳(メタデータ) (2023-07-30T16:08:45Z) - A Novel Collaborative Self-Supervised Learning Method for Radiomic Data [3.5213632537596604]
本稿では,ラベル付き無線データ不足の課題を解決するための,新しい自己教師型学習手法を提案する。
提案手法は, 放射線データから頑健な潜在特徴表現を自己指導的に学習し, 人間のアノテーションの取り組みを減らした。
論文 参考訳(メタデータ) (2023-02-20T07:15:28Z) - Single-round Self-supervised Distributed Learning using Vision
Transformer [34.76985278888513]
視覚変換器の自己監督型マスクサンプリング蒸留法を提案する。
この方法は、連続的な通信なしに実装でき、ビジョントランスフォーマー固有の暗号化技術を利用することで、プライバシーを高めることができる。
論文 参考訳(メタデータ) (2023-01-05T13:47:36Z) - CholecTriplet2021: A benchmark challenge for surgical action triplet
recognition [66.51610049869393]
腹腔鏡下手術における三肢の認識のためにMICCAI 2021で実施した内視鏡的視力障害であるColecTriplet 2021を提案する。
課題の参加者が提案する最先端の深層学習手法の課題設定と評価について述べる。
4つのベースライン法と19の新しいディープラーニングアルゴリズムが提示され、手術ビデオから直接手術行動三重項を認識し、平均平均精度(mAP)は4.2%から38.1%である。
論文 参考訳(メタデータ) (2022-04-10T18:51:55Z) - Unsupervised deep learning techniques for powdery mildew recognition
based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。
マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。
本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文 参考訳(メタデータ) (2021-12-20T13:29:13Z) - One-shot action recognition towards novel assistive therapies [63.23654147345168]
この作業は、アクション模倣ゲームを含む医療療法の自動分析によって動機づけられます。
提案手法は、異種運動データ条件を標準化する前処理ステップを組み込んだものである。
自閉症者に対するセラピー支援のための自動ビデオ分析の実際の利用事例について検討した。
論文 参考訳(メタデータ) (2021-02-17T19:41:37Z) - Self-supervised Feature Learning via Exploiting Multi-modal Data for
Retinal Disease Diagnosis [28.428216831922228]
本稿では,網膜疾患診断のためのマルチモーダルデータを効果的に活用して,新しい自己教師型特徴学習法を提案する。
本研究の目的は,モダリティ不変特徴と患者類似特徴の両方を学習することである。
本手法を網膜疾患診断のための2つの公開ベンチマークデータセットで評価した。
論文 参考訳(メタデータ) (2020-07-21T19:49:45Z) - Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。
本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。
結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文 参考訳(メタデータ) (2020-03-23T14:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。