論文の概要: Prompt-enhanced Hierarchical Transformer Elevating Cardiopulmonary
Resuscitation Instruction via Temporal Action Segmentation
- arxiv url: http://arxiv.org/abs/2308.16552v1
- Date: Thu, 31 Aug 2023 08:43:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-01 15:15:17.175106
- Title: Prompt-enhanced Hierarchical Transformer Elevating Cardiopulmonary
Resuscitation Instruction via Temporal Action Segmentation
- Title(参考訳): テンポラルアクションセグメンテーションによる心肺蘇生指導の迅速強化型階層型トランスフォーマ
- Authors: Yang Liu, Xiaoyun Zhong, Shiyao Zhai, Zhicheng Du, Zhenyuan Gao,
Qiming Huang, Canyang Zhang, Bin Jiang, Vijay Kumar Pandey, Sanyang Han,
Runming Wang, Yuxing Han and Peiwu Qin
- Abstract要約: 我々は、訓練生がマネキンの蘇生を独立して行うカスタムCPRビデオデータセットを収集する。
我々の研究は、この問題をコンピュータビジョンにおける時間的アクションセグメンテーション(TAS)タスクとして経験的に捉えている。
本稿では,3つの不必要なモジュールを統合するPhiTrans(Prompt-enhanced Hierarchical Transformer)を提案する。
- 参考スコア(独自算出の注目度): 9.267638428342245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The vast majority of people who suffer unexpected cardiac arrest are
performed cardiopulmonary resuscitation (CPR) by passersby in a desperate
attempt to restore life, but endeavors turn out to be fruitless on account of
disqualification. Fortunately, many pieces of research manifest that
disciplined training will help to elevate the success rate of resuscitation,
which constantly desires a seamless combination of novel techniques to yield
further advancement. To this end, we collect a custom CPR video dataset in
which trainees make efforts to behave resuscitation on mannequins independently
in adherence to approved guidelines, thereby devising an auxiliary toolbox to
assist supervision and rectification of intermediate potential issues via
modern deep learning methodologies. Our research empirically views this problem
as a temporal action segmentation (TAS) task in computer vision, which aims to
segment an untrimmed video at a frame-wise level. Here, we propose a
Prompt-enhanced hierarchical Transformer (PhiTrans) that integrates three
indispensable modules, including a textual prompt-based Video Features
Extractor (VFE), a transformer-based Action Segmentation Executor (ASE), and a
regression-based Prediction Refinement Calibrator (PRC). The backbone of the
model preferentially derives from applications in three approved public
datasets (GTEA, 50Salads, and Breakfast) collected for TAS tasks, which
accounts for the excavation of the segmentation pipeline on the CPR dataset. In
general, we unprecedentedly probe into a feasible pipeline that genuinely
elevates the CPR instruction qualification via action segmentation in
conjunction with cutting-edge deep learning techniques. Associated experiments
advocate our implementation with multiple metrics surpassing 91.0%.
- Abstract(参考訳): 予期せぬ心停止に苦しむ人々の大多数は、通行人によって心肺蘇生(cpr)を行い、必死に生活を回復させようとするが、失格のために努力は実り得ない。
幸いなことに、規律ある訓練が蘇生の成功率を高めるのに役立ち、新しい技術のシームレスな組み合わせを常に望んでいます。
そこで,本研究では,提案するガイドラインに従わずにマネキンの蘇生行動に自力で努力するカスタムcprビデオデータセットを収集し,現代的深層学習手法による中間的潜在的な問題の監督・修正を支援する補助ツールボックスを開発した。
本研究は,非トリミング映像をフレームレベルで分割することを目的とした,コンピュータビジョンにおける時間的行動分節化(tas)タスクとしてこの問題を実証的に捉えている。
本稿では,PhiTrans(Prompt-enhanced Hierarchical Transformer)を提案する。テキストプロンプトベースのビデオ特徴抽出器(VFE),トランスフォーマーベースのアクションセグメンテーション実行器(ASE),レグレッションベースの予測リファインメントキャリブレータ(PRC)の3つの不必要なモジュールを統合する。
モデルのバックボーンは、3つの承認されたパブリックデータセット(GTEA、50Salads、Breakfast)で収集されたTASタスクのアプリケーションから優先的に派生している。
一般に、我々は、最先端の深層学習技術と合わせて、アクションセグメンテーションによるCPR指導資格を真に高めることが可能なパイプラインを探索する。
関連する実験では、複数のメトリクスで91.0%を超える実装を提唱しています。
関連論文リスト
- Weakly-Supervised Learning via Multi-Lateral Decoder Branching for Guidewire Segmentation in Robot-Assisted Cardiovascular Catheterization [4.894147633944561]
心臓血管造影検査におけるツールセグメンテーションのための多面的擬似ラベリングを用いた弱教師付き学習法を提案する。
我々は,ロボット心カテーテル手術中に得られた弱注釈データを用いて,エンドツーエンドのモデルを訓練した。
従来の3種類の心血管造影法と比較して,3種類の心血管造影データに対して高いセグメンテーション性能を示した。
論文 参考訳(メタデータ) (2024-04-11T09:23:44Z) - Enhancing Weakly Supervised 3D Medical Image Segmentation through
Probabilistic-aware Learning [52.249748801637196]
3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。
近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。
本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-05T00:46:53Z) - Hierarchical Decomposition of Prompt-Based Continual Learning:
Rethinking Obscured Sub-optimality [55.88910947643436]
大量のラベルのないデータを実際に扱うためには、自己教師付き事前トレーニングが不可欠である。
HiDe-Promptは、タスク固有のプロンプトと統計のアンサンブルで階層的なコンポーネントを明示的に最適化する革新的なアプローチである。
実験では,HiDe-Promptの優れた性能と,継続学習における事前学習パラダイムへの頑健さを実証した。
論文 参考訳(メタデータ) (2023-10-11T06:51:46Z) - COMEDIAN: Self-Supervised Learning and Knowledge Distillation for Action
Spotting using Transformers [1.894259749028573]
動作スポッティングのためのトランスフォーマーを初期化する新しいパイプラインであるCOMEDIANを提案する。
この結果から,非事前学習モデルと比較して,性能の向上や収束の高速化など,事前学習パイプラインのメリットを浮き彫りにしている。
論文 参考訳(メタデータ) (2023-09-03T20:50:53Z) - Understanding and Mitigating Overfitting in Prompt Tuning for
Vision-Language Models [108.13378788663196]
本稿では, トレーニング過程全体において, 低ランク部分空間にバックプロパゲーションの勾配を投影するSubspace Prompt Tuning(SubPT)を提案する。
我々はCoOpにノベル・ラーナー・フィーチャー(NFL)を装備し、学習したプロンプトをトレーニングセット以外の新しいカテゴリに一般化する能力を高める。
論文 参考訳(メタデータ) (2022-11-04T02:06:22Z) - Hierarchically Self-Supervised Transformer for Human Skeleton
Representation Learning [45.13060970066485]
階層型トランスフォーマーベーススケルトンシーケンスエンコーダ(Hi-TRS)に組み込まれた自己教師型階層型事前学習方式を提案する。
教師付き評価プロトコルと半教師付き評価プロトコルの両方で,本手法は最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-07-20T04:21:05Z) - What Makes for Automatic Reconstruction of Pulmonary Segments [50.216231776343115]
肺の3次元再構成は肺癌の外科的治療計画において重要な役割を担っている。
しかし, 深層学習の時代には, 肺部分の自動再建は行われていない。
肺セグメント再建のための深部暗黙表面モデルImPulSeを提案する。
論文 参考訳(メタデータ) (2022-07-07T04:24:17Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z) - Contrastive and Selective Hidden Embeddings for Medical Image
Segmentation [25.80192874762209]
医用画像セグメンテーションのための対照的な学習ベース重み事前トレーニングを提案する。
不確実性を考慮した特徴選択ブロック(UAFS)と呼ばれる新しい構造は、少数機能による学習目標シフトを処理するように設計されている。
6つのドメインから8つのパブリックデータセットにまたがって、最先端の結果が得られます。
論文 参考訳(メタデータ) (2022-01-21T16:52:19Z) - Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance
Video [128.41392860714635]
Weakly-Supervised Snoma-Temporally Detection (WSSTAD) を監視ビデオに導入する。
WSSTADは異常事象を封止する時空間管(すなわち連続する境界ボックスのシーケンス)をローカライズすることを目的としている。
本稿では,空間的・時間的領域に複数粒度を持つ入力提案を行うデュアルブランチネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:11:14Z) - Unsupervised Temporal Video Segmentation as an Auxiliary Task for
Predicting the Remaining Surgery Duration [0.03131740922192113]
外科手術中の残存手術期間(RSD)を推定することは、OR計画および麻酔線量推定に有用である。
本研究では,教師なしの時間的ビデオセグメンテーションを補助学習タスクとして利用することにより,RTD予測を改善することができるかどうかを検討する。
論文 参考訳(メタデータ) (2020-02-26T09:13:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。