論文の概要: MMeViT: Multi-Modal ensemble ViT for Post-Stroke Rehabilitation Action Recognition
- arxiv url: http://arxiv.org/abs/2509.23044v1
- Date: Sat, 27 Sep 2025 01:46:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.002475
- Title: MMeViT: Multi-Modal ensemble ViT for Post-Stroke Rehabilitation Action Recognition
- Title(参考訳): MMeViT:ポストストロークリハビリテーション行動認識のためのマルチモーダルアンサンブルViT
- Authors: Ye-eun Kim, Suhyeon Lim, Andrew J. Choi,
- Abstract要約: 遠隔監視システムの主要なコンポーネントは、アクションを分類するヒューマンアクション認識(HAR)技術である。
脳卒中の研究は、ディープラーニングではなく機械学習を用いて比較的単純なアクションを分類することに集中してきた。
本研究では,脳卒中患者の行動を監視するシステムを構築し,日常生活上肢活動(ADL)に着目した。
その結果,脳卒中患者の行動データは,非障害者よりもクラスタリングが低いことがわかった。
- 参考スコア(独自算出の注目度): 1.0781866671930853
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rehabilitation therapy for stroke patients faces a supply shortage despite the increasing demand. To address this issue, remote monitoring systems that reduce the burden on medical staff are emerging as a viable alternative. A key component of these remote monitoring systems is Human Action Recognition (HAR) technology, which classifies actions. However, existing HAR studies have primarily focused on non-disable individuals, making them unsuitable for recognizing the actions of stroke patients. HAR research for stroke has largely concentrated on classifying relatively simple actions using machine learning rather than deep learning. In this study, we designed a system to monitor the actions of stroke patients, focusing on domiciliary upper limb Activities of Daily Living (ADL). Our system utilizes IMU (Inertial Measurement Unit) sensors and an RGB-D camera, which are the most common modalities in HAR. We directly collected a dataset through this system, investigated an appropriate preprocess and proposed a deep learning model suitable for processing multimodal data. We analyzed the collected dataset and found that the action data of stroke patients is less clustering than that of non-disabled individuals. Simultaneously, we found that the proposed model learns similar tendencies for each label in data with features that are difficult to clustering. This study suggests the possibility of expanding the deep learning model, which has learned the action features of stroke patients, to not only simple action recognition but also feedback such as assessment contributing to domiciliary rehabilitation in future research. The code presented in this study is available at https://github.com/ye-Kim/MMeViT.
- Abstract(参考訳): 脳卒中患者のリハビリテーション療法は、需要の増加にもかかわらず供給不足に直面している。
この問題に対処するため、医療スタッフの負担を軽減する遠隔監視システムが現実的な代替手段として浮上している。
これらの遠隔監視システムの主要なコンポーネントは、アクションを分類するヒューマンアクション認識(HAR)技術である。
しかし、既存のHAR研究は主に障害のない人に焦点を当てており、脳卒中患者の行動を認識するには不適当である。
脳卒中のためのHAR研究は、ディープラーニングではなく機械学習を用いて比較的単純なアクションを分類することに集中している。
本研究では,脳卒中患者の行動を監視するシステムを構築し,日常生活上肢活動(ADL)に着目した。
本システムでは,IMU(Inertial Measurement Unit)センサとRGB-Dカメラを利用する。
このシステムを通じてデータセットを直接収集し、適切な事前処理を調査し、マルチモーダルデータ処理に適したディープラーニングモデルを提案する。
その結果,脳卒中患者の行動データは,非障害者よりもクラスタリングが低いことがわかった。
同時に,提案モデルでは,クラスタリングが困難である特徴を持つデータにおいて,各ラベルの類似傾向を学習する。
本研究は, 脳卒中患者の行動特徴を学習した深層学習モデルを, 簡便な行動認識だけでなく, 将来の医学的リハビリテーションに寄与する評価などのフィードバックに拡張する可能性を示唆する。
この研究で提示されたコードはhttps://github.com/ye-Kim/MMeViT.comで公開されている。
関連論文リスト
- Improving Out-of-distribution Human Activity Recognition via IMU-Video Cross-modal Representation Learning [3.177649348456073]
ウェアラブル慣性センサーに基づくヒューマンアクティビティ認識(HAR)は,遠隔健康モニタリングにおいて重要な役割を担っている。
我々は,大規模未ラベルIMUビデオデータから表現を学習するための,クロスモーダルな自己教師型事前学習手法を提案する。
以上の結果から,提案手法は現状のIMU-ビデオ事前訓練手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-07-17T18:47:46Z) - Multimodal Contrastive Learning with Hard Negative Sampling for Human
Activity Recognition [14.88934924520362]
HAR(Human Activity Recognition)システムは、ビジョンとユビキタスコンピューティングコミュニティによって広く研究されている。
骨格とIMUデータペアのハードネガティブサンプリング損失を有するマルチモーダルHARのハードネガティブサンプリング法を提案する。
我々は,HARタスクの強い特徴表現を学習するためのアプローチの頑健さと,限られたデータ設定上での頑健さを実証する。
論文 参考訳(メタデータ) (2023-09-03T20:00:37Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z) - Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach [0.0]
動的処理レジーム(DTR)は、このプロセスの形式化のために広く研究されている。
最適な治療体制を効率的に学習するための強化学習法を開発した。
論文 参考訳(メタデータ) (2021-12-08T20:22:04Z) - Active Selection of Classification Features [0.0]
人口統計などの補助的データは、最も有益なMRIスキャンを持つ個人を含む小さなサンプルを選択するのに役立ちます。
本研究では,2つの実用的手法を提案し,その性能を3つの実世界のベンチマークデータセットで評価する。
論文 参考訳(メタデータ) (2021-02-26T18:19:08Z) - Relational Graph Learning on Visual and Kinematics Embeddings for
Accurate Gesture Recognition in Robotic Surgery [84.73764603474413]
本稿では,マルチモーダルグラフネットワーク(MRG-Net)の新たなオンラインアプローチを提案し,視覚情報とキネマティクス情報を動的に統合する。
本手法の有効性は, JIGSAWSデータセット上での最先端の成果で実証された。
論文 参考訳(メタデータ) (2020-11-03T11:00:10Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。