論文の概要: Learning to Estimate Critical Gait Parameters from Single-View RGB
Videos with Transformer-Based Attention Network
- arxiv url: http://arxiv.org/abs/2312.00398v2
- Date: Fri, 1 Mar 2024 06:33:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-04 13:59:32.622343
- Title: Learning to Estimate Critical Gait Parameters from Single-View RGB
Videos with Transformer-Based Attention Network
- Title(参考訳): トランスフォーマー型アテンションネットワークを用いた単視点rgbビデオからの臨界歩行パラメータ推定の学習
- Authors: Quoc Hung T. Le, Hieu H. Pham
- Abstract要約: 本稿では,一眼レフカメラで撮影したRGBビデオから重要な歩行パラメータを推定するトランスフォーマーネットワークを提案する。
脳性麻痺患者の公的データセットに関する実証的な評価は、このフレームワークが現在の最先端のアプローチを超越していることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Musculoskeletal diseases and cognitive impairments in patients lead to
difficulties in movement as well as negative effects on their psychological
health. Clinical gait analysis, a vital tool for early diagnosis and treatment,
traditionally relies on expensive optical motion capture systems. Recent
advances in computer vision and deep learning have opened the door to more
accessible and cost-effective alternatives. This paper introduces a novel
spatio-temporal Transformer network to estimate critical gait parameters from
RGB videos captured by a single-view camera. Empirical evaluations on a public
dataset of cerebral palsy patients indicate that the proposed framework
surpasses current state-of-the-art approaches and show significant improvements
in predicting general gait parameters (including Walking Speed, Gait Deviation
Index - GDI, and Knee Flexion Angle at Maximum Extension), while utilizing
fewer parameters and alleviating the need for manual feature extraction.
- Abstract(参考訳): 患者の筋骨格疾患や認知障害は、運動の困難を招き、心理的健康に悪影響を及ぼす。
早期診断と治療のための重要なツールである臨床歩行分析は、伝統的に高価な光学式モーションキャプチャシステムに依存している。
コンピュータビジョンとディープラーニングの最近の進歩は、よりアクセスしやすく、コスト効率の良い代替手段への扉を開いた。
本稿では,一眼レフカメラで撮影したRGBビデオから重要な歩行パラメータを推定する新しい時空間トランスフォーマーネットワークを提案する。
脳性麻痺患者の公的データセットを用いた経験的評価は、提案フレームワークが現在の最先端アプローチを超越し、一般的な歩行パラメータ(歩行速度、歩行偏差指数 - GDI、Knee Flexion Angle at Maximum Extension)の予測において大幅な改善を示し、パラメータが少ないこと、手動の特徴抽出の必要性を軽減することを示唆している。
関連論文リスト
- Developing Normative Gait Cycle Parameters for Clinical Analysis Using Human Pose Estimation [4.975410989590524]
コンピュータビジョンを用いた歩行分析はAIの新たな分野であり、臨床医に複雑な動きを分析するための客観的で多機能なアプローチを提供する。
本稿では,RGBビデオデータと2次元人間のポーズ推定を用いたデータ駆動手法を提案する。
論文 参考訳(メタデータ) (2024-11-20T21:27:13Z) - Analyzing the Effect of $k$-Space Features in MRI Classification Models [0.0]
医用イメージングに適した説明可能なAI手法を開発した。
我々は、画像領域と周波数領域の両方にわたるMRIスキャンを分析する畳み込みニューラルネットワーク(CNN)を採用している。
このアプローチは、初期のトレーニング効率を高めるだけでなく、追加機能がモデル予測にどのように影響するかの理解を深めます。
論文 参考訳(メタデータ) (2024-09-20T15:43:26Z) - Deep intra-operative illumination calibration of hyperspectral cameras [73.08443963791343]
ハイパースペクトルイメージング (HSI) は, 様々な手術応用に期待できる新しい画像モダリティとして出現している。
手術室における照明条件の動的変化がHSIアプリケーションの性能に劇的な影響を及ぼすことを示す。
手術中におけるハイパースペクトル画像の自動再構成のための新しい学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-11T08:30:03Z) - L-SFAN: Lightweight Spatially-focused Attention Network for Pain Behavior Detection [44.016805074560295]
慢性的な腰痛 (CLBP) は世界中の何百万もの患者を悩ませており、個人の健康や医療システムに対する経済的負担に大きな影響を及ぼす。
人工知能(AI)とディープラーニングは、リハビリ戦略を改善するために痛みに関連する行動を分析するための有望な道を提供するが、畳み込みニューラルネットワーク(CNN)を含む現在のモデルには限界がある。
我々は、モーションキャプチャーと表面筋電図センサからデータの空間的時間的相互作用をキャプチャする2Dフィルタを組み込んだ軽量CNNアーキテクチャであるhbox EmoL-SFANを紹介する。
論文 参考訳(メタデータ) (2024-06-07T12:01:37Z) - GLSFormer : Gated - Long, Short Sequence Transformer for Step
Recognition in Surgical Videos [57.93194315839009]
本稿では,シーケンスレベルのパッチから時間的特徴を直接学習するための視覚変換器に基づくアプローチを提案する。
本研究では,白内障手術用ビデオデータセットである白内障-101とD99に対するアプローチを広範に評価し,各種の最先端手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2023-07-20T17:57:04Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Hyper-parameter Adaptation of Conformer ASR Systems for Elderly and
Dysarthric Speech Recognition [64.9816313630768]
ファインチューニングは、多くの非高齢および健康な音声事前訓練モデルを利用するためにしばしば用いられる。
本稿では,Librispeech corpus 上で事前学習した Conformer ASR システムのハイパーパラメータ適応について検討する。
論文 参考訳(メタデータ) (2023-06-27T07:49:35Z) - No Parameters Left Behind: Sensitivity Guided Adaptive Learning Rate for
Training Large Transformer Models [132.90062129639705]
本稿では,全てのパラメータを十分に訓練するための新しいトレーニング戦略を提案する。
感度の低いパラメータは冗長であり、学習率を高めて適合性を改善する。
対照的に、高い感度を持つパラメータを十分に訓練し、学習率を下げて正規化することで、さらなる過度なオーバーフィッティングを防止する。
論文 参考訳(メタデータ) (2022-02-06T00:22:28Z) - Automated Prostate Cancer Diagnosis Based on Gleason Grading Using
Convolutional Neural Network [12.161266795282915]
そこで本研究では,前立腺癌(PCa)の完全分類のための畳み込みニューラルネットワーク(CNN)を用いた自動分類法を提案する。
Patch-Based Image Reconstruction (PBIR) と呼ばれるデータ拡張手法が提案され,WSIの高分解能化と多様性の向上が図られた。
対象データセットへの事前学習モデルの適応性を高めるために,分布補正モジュールを開発した。
論文 参考訳(メタデータ) (2020-11-29T06:42:08Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z) - A Single RGB Camera Based Gait Analysis with a Mobile Tele-Robot for
Healthcare [9.992387025633805]
この研究は、関節矯正や下肢や脊椎の問題評価に広く採用されている歩行の分析に焦点を当てている。
ハードウェア側では,移動ロボットに搭載された低コストのRGBカメラを用いたマーカーレス歩行解析装置を設計する。
論文 参考訳(メタデータ) (2020-02-11T21:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。