論文の概要: ARST: Auto-Regressive Surgical Transformer for Phase Recognition from
Laparoscopic Videos
- arxiv url: http://arxiv.org/abs/2209.01148v1
- Date: Fri, 2 Sep 2022 16:05:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 12:03:44.470751
- Title: ARST: Auto-Regressive Surgical Transformer for Phase Recognition from
Laparoscopic Videos
- Title(参考訳): ARST:腹腔鏡画像からの位相認識のための自己回帰型外科用トランス
- Authors: Xiaoyang Zou, Wenyong Liu, Junchen Wang, Rong Tao and Guoyan Zheng
- Abstract要約: 自然言語処理における逐次データモデリングのために提案されたTransformerは,外科的位相認識に成功している。
本研究では, 腹腔鏡下画像からのオンライン手術位相認識のために, ARSTと呼ばれる自動回帰手術変換器が最初に提案されている。
- 参考スコア(独自算出の注目度): 2.973286445527318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Phase recognition plays an essential role for surgical workflow analysis in
computer assisted intervention. Transformer, originally proposed for sequential
data modeling in natural language processing, has been successfully applied to
surgical phase recognition. Existing works based on transformer mainly focus on
modeling attention dependency, without introducing auto-regression. In this
work, an Auto-Regressive Surgical Transformer, referred as ARST, is first
proposed for on-line surgical phase recognition from laparoscopic videos,
modeling the inter-phase correlation implicitly by conditional probability
distribution. To reduce inference bias and to enhance phase consistency, we
further develop a consistency constraint inference strategy based on
auto-regression. We conduct comprehensive validations on a well-known public
dataset Cholec80. Experimental results show that our method outperforms the
state-of-the-art methods both quantitatively and qualitatively, and achieves an
inference rate of 66 frames per second (fps).
- Abstract(参考訳): コンピュータ支援介入における手術ワークフロー解析には位相認識が不可欠である。
自然言語処理における逐次データモデリングのために提案されたTransformerは,外科的位相認識に成功している。
トランスフォーマーに基づく既存の作業は、自動回帰を導入することなく、主に注意依存のモデリングに焦点を当てている。
本研究では, 腹腔鏡画像からのオンライン手術位相認識のためにARSTと呼ばれる自動回帰手術変換器を提案し, 条件付き確率分布による位相相関を暗黙的にモデル化した。
推論バイアスを低減し、位相整合性を高めるため、自動回帰に基づく一貫性制約推論戦略をさらに発展させる。
よく知られている公開データセットであるCholec80上で、包括的な検証を行います。
実験の結果,本手法は定量的および定性的に最先端手法を上回っており,1秒あたり66フレーム(fps)の推論が可能であった。
関連論文リスト
- Semantic Self-adaptation: Enhancing Generalization with a Single Sample [53.869943977217574]
本稿では,各サンプルに対する推論プロセスを調整するセマンティックセグメンテーションの自己適応的手法を提案する。
自己適応推論は強いベースラインを著しく上回り、マルチドメインベンチマークで新しい最先端の精度を設定できる。
論文 参考訳(メタデータ) (2022-08-10T12:29:01Z) - SCouT: Synthetic Counterfactuals via Spatiotemporal Transformers for
Actionable Healthcare [6.431557011732579]
合成制御法は、ドナーユニットからユニットの対実的現実を推定する強力なデータ駆動手法のクラスを開拓した。
中心となる技術は、ドナーの結果を結合して偽物を生成する、事前介入期間に適合した線形モデルである。
提案手法は,介入の開始前における局所的時間的情報の利用を,事象列を推定する有望な方法として提案する。
論文 参考訳(メタデータ) (2022-07-09T07:00:17Z) - Surgical Phase Recognition in Laparoscopic Cholecystectomy [57.929132269036245]
本稿では,2段階推論パイプラインのキャリブレーションされた信頼度スコアを利用するTransformerに基づく手法を提案する。
提案手法はColec80データセットのベースラインモデルよりも優れており,様々なアクションセグメンテーション手法に適用できる。
論文 参考訳(メタデータ) (2022-06-14T22:55:31Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - Trans-SVNet: Accurate Phase Recognition from Surgical Videos via Hybrid
Embedding Aggregation Transformer [57.18185972461453]
本稿では,手術ワークフロー解析トランスフォーマーを初めて導入し,正確な位相認識のための時間的特徴と時間的特徴の無視された補完効果を再考する。
我々のフレームワークは軽量であり、高い推論速度を達成するためにハイブリッド埋め込みを並列に処理します。
論文 参考訳(メタデータ) (2021-03-17T15:12:55Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - TeCNO: Surgical Phase Recognition with Multi-Stage Temporal
Convolutional Networks [43.95869213955351]
外科的位相認識のための階層的予測補正を行う多段階時間畳み込みネットワーク(MS-TCN)を提案する。
本手法は腹腔鏡下胆嚢摘出術ビデオの2つのデータセットに対して,追加の外科的ツール情報を用いずに徹底的に評価した。
論文 参考訳(メタデータ) (2020-03-24T10:12:30Z) - Automatic Data Augmentation via Deep Reinforcement Learning for
Effective Kidney Tumor Segmentation [57.78765460295249]
医用画像セグメンテーションのための新しい学習ベースデータ拡張法を開発した。
本手法では,データ拡張モジュールと後続のセグメンテーションモジュールをエンドツーエンドのトレーニング方法で一貫した損失と,革新的に組み合わせる。
提案法の有効性を検証したCT腎腫瘍分節法について,本法を広範囲に評価した。
論文 参考訳(メタデータ) (2020-02-22T14:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。