論文の概要: Automated ARAT Scoring Using Multimodal Video Analysis, Multi-View Fusion, and Hierarchical Bayesian Models: A Clinician Study
- arxiv url: http://arxiv.org/abs/2505.01680v1
- Date: Sat, 03 May 2025 04:00:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.227475
- Title: Automated ARAT Scoring Using Multimodal Video Analysis, Multi-View Fusion, and Hierarchical Bayesian Models: A Clinician Study
- Title(参考訳): マルチモーダルビデオ解析, マルチビューフュージョン, 階層ベイズモデルを用いたARATの自動描画:臨床的検討
- Authors: Tamim Ahmed, Thanassis Rikakis,
- Abstract要約: 脳卒中リハビリテーションにおける上肢評価のための行動研究アームテスト(ARAT)のマニュアルスコアリングは時間集約的かつ変動的である。
マルチモーダルビデオ解析をSlowFast, I3D, Transformerベースのモデルと統合した自動ARATスコアリングシステムを提案する。
この研究は、クリニカルバリデーションを備えたスケーラブルで解釈可能なソリューションを提供することで、自動リハビリテーションを進める。
- 参考スコア(独自算出の注目度): 1.0463644684200606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Manual scoring of the Action Research Arm Test (ARAT) for upper extremity assessment in stroke rehabilitation is time-intensive and variable. We propose an automated ARAT scoring system integrating multimodal video analysis with SlowFast, I3D, and Transformer-based models using OpenPose keypoints and object locations. Our approach employs multi-view data (ipsilateral, contralateral, and top perspectives), applying early and late fusion to combine features across views and models. Hierarchical Bayesian Models (HBMs) infer movement quality components, enhancing interpretability. A clinician dashboard displays task scores, execution times, and quality assessments. We conducted a study with five clinicians who reviewed 500 video ratings generated by our system, providing feedback on its accuracy and usability. Evaluated on a stroke rehabilitation dataset, our framework achieves 89.0% validation accuracy with late fusion, with HBMs aligning closely with manual assessments. This work advances automated rehabilitation by offering a scalable, interpretable solution with clinical validation.
- Abstract(参考訳): 脳卒中リハビリテーションにおける上肢評価のための行動研究アームテスト(ARAT)のマニュアルスコアリングは時間集約的かつ変動的である。
マルチモーダルビデオ解析をSlowFast, I3D, Transformerベースのモデルと統合した自動ARATスコアリングシステムを提案する。
提案手法では,多視点データ(対極的,対極的,トップパースペクティブ)を用いて,ビューとモデルにまたがる特徴を組み合わせるために,早期と後期の融合を適用した。
階層ベイズモデル(HBM)は、運動品質の要素を推測し、解釈可能性を高める。
臨床ダッシュボードには、タスクスコア、実行時間、品質評価が表示される。
5人の臨床医を対象に,本システムで生成した500件のビデオ評価をレビューし,その精度とユーザビリティに関するフィードバックを得た。
脳卒中リハビリテーションデータセットを用いて,本フレームワークは後期核融合による89.0%の検証精度を達成し,HBMは手動による評価と密接に一致している。
この研究は、クリニカルバリデーションを備えたスケーラブルで解釈可能なソリューションを提供することで、自動リハビリテーションを進める。
関連論文リスト
- VideoGen-Eval: Agent-based System for Video Generation Evaluation [54.662739174367836]
ビデオ生成は、最先端のモデルを評価するのに、既存の評価システムを不十分にしている。
本稿では,コンテンツ構造化,MLLMに基づくコンテンツ判断,時空間次元のパッチツールを統合したエージェント評価システムであるVideoGen-Evalを提案する。
我々は,既存の最先端モデルを評価するためのビデオ生成ベンチマークを導入し,評価システムの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-30T14:12:21Z) - Efficient Frame Extraction: A Novel Approach Through Frame Similarity and Surgical Tool Tracking for Video Segmentation [0.0]
本稿では,余剰フレームを効率的に除去し,データセットのサイズや計算時間を短縮する手法を提案する。
具体的には,手術器具の移動を追跡することで,連続するフレーム間の類似性を計算する。
症例の振り返りレビューから得られたデータセットを解析し,提案手法の有効性を評価する。
論文 参考訳(メタデータ) (2025-01-19T19:36:09Z) - Towards Robust Algorithms for Surgical Phase Recognition via Digital Twin Representation [13.388576093178887]
ビデオからの位相認識のためのDT表現に基づくフレームワークを提案する。
フレームワークはColec80データセットに基づいてトレーニングされ、配布外および破損したテストサンプルに基づいて評価される。
本研究は,DT表現がモデルロバスト性の向上に有効であるという仮説を支持した。
論文 参考訳(メタデータ) (2024-10-26T00:49:06Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - D-STGCNT: A Dense Spatio-Temporal Graph Conv-GRU Network based on transformer for assessment of patient physical rehabilitation [0.30693357740321775]
本稿では,リハビリテーション演習を評価するための新しいグラフベースモデルを提案する。
デンス接続とGRU機構は、大きな3Dスケルトン入力を迅速に処理するために使用される。
KIMOREおよびUI-PRMDデータセットに対する提案手法の評価は,その可能性を強調した。
論文 参考訳(メタデータ) (2023-12-21T00:38:31Z) - Coordinate Transformer: Achieving Single-stage Multi-person Mesh
Recovery from Videos [91.44553585470688]
ビデオから複数人の3Dメッシュを回収することは、バーチャルリアリティーや理学療法などにおけるグループ行動の自動認識に向けた重要な第一歩である。
本稿では,複数人物の時空間関係を直接モデル化し,同時にエンドツーエンドでマルチ・メッシュ・リカバリを行うコーディネート・トランスフォーマーを提案する。
3DPWデータセットの実験では、CoordFormerが最先端の精度を大幅に向上し、MPJPE、PAMPJPE、PVEの計測値でそれぞれ4.2%、8.8%、そして4.7%を上回った。
論文 参考訳(メタデータ) (2023-08-20T18:23:07Z) - Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。
その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。
再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文 参考訳(メタデータ) (2023-04-21T11:54:44Z) - Tele-EvalNet: A Low-cost, Teleconsultation System for Home based
Rehabilitation of Stroke Survivors using Multiscale CNN-LSTM Architecture [7.971065005161566]
本稿では,ライブフィードバックモデルと全体的なパフォーマンス評価モデルという,2つのコンポーネントからなる新しいシステムであるTele-EvalNetを提案する。
ライブフィードバックモデルは、カラーマーカーを使用してハイライトされた指示を簡単に理解し、エクササイズ正しさに関するフィードバックを示す。
総合的なパフォーマンス評価モデルでは,臨床医の成績に応じて,関節データのスコアへのマッピングを学習する。
論文 参考訳(メタデータ) (2021-12-06T16:58:00Z) - One-shot action recognition towards novel assistive therapies [63.23654147345168]
この作業は、アクション模倣ゲームを含む医療療法の自動分析によって動機づけられます。
提案手法は、異種運動データ条件を標準化する前処理ステップを組み込んだものである。
自閉症者に対するセラピー支援のための自動ビデオ分析の実際の利用事例について検討した。
論文 参考訳(メタデータ) (2021-02-17T19:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。