論文の概要: SDFA: Structure Aware Discriminative Feature Aggregation for Efficient Human Fall Detection in Video
- arxiv url: http://arxiv.org/abs/2503.07008v1
- Date: Mon, 10 Mar 2025 07:46:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:48:06.168600
- Title: SDFA: Structure Aware Discriminative Feature Aggregation for Efficient Human Fall Detection in Video
- Title(参考訳): SDFA:ビデオにおける効率的なヒューマンフォール検出のための識別的特徴集約
- Authors: Sania Zahan, Ghulam Mubashar Hassan, Ajmal Mian,
- Abstract要約: 高齢者は、姿勢の不安定さと健康の悪化により転倒するおそれがある。
低解像度ビデオから抽出した人間の骨格に基づく転倒検出モデルSDFAを提案する。
本モデルでは,共有高次元空間上に投影される統一関節および運動特徴を用いて,識別的構造変位と動きの傾向を捉える。
- 参考スコア(独自算出の注目度): 25.57448683000322
- License:
- Abstract: Older people are susceptible to fall due to instability in posture and deteriorating health. Immediate access to medical support can greatly reduce repercussions. Hence, there is an increasing interest in automated fall detection, often incorporated into a smart healthcare system to provide better monitoring. Existing systems focus on wearable devices which are inconvenient or video monitoring which has privacy concerns. Moreover, these systems provide a limited perspective of their generalization ability as they are tested on datasets containing few activities that have wide disparity in the action space and are easy to differentiate. Complex daily life scenarios pose much greater challenges with activities that overlap in action spaces due to similar posture or motion. To overcome these limitations, we propose a fall detection model, coined SDFA, based on human skeletons extracted from low-resolution videos. The use of skeleton data ensures privacy and low-resolution videos ensures low hardware and computational cost. Our model captures discriminative structural displacements and motion trends using unified joint and motion features projected onto a shared high dimensional space. Particularly, the use of separable convolution combined with a powerful GCN architecture provides improved performance. Extensive experiments on five large-scale datasets with a wide range of evaluation settings show that our model achieves competitive performance with extremely low computational complexity and runs faster than existing models.
- Abstract(参考訳): 高齢者は、姿勢の不安定さと健康の悪化により転倒するおそれがある。
医療支援への即時アクセスは、反感を大幅に減らすことができる。
そのため、自動転倒検出への関心が高まっており、監視を改善するためにスマートヘルスケアシステムに組み込まれることが多い。
既存のシステムは、不便なウェアラブルデバイスや、プライバシー上の懸念のあるビデオ監視に重点を置いている。
さらに、これらのシステムは、アクション空間に広く差異があり、識別が容易な、少数のアクティビティを含むデータセット上でテストされるため、一般化能力の限られた視点を提供する。
複雑な日常生活シナリオは、同様の姿勢や動きによって行動空間に重複する活動において、はるかに大きな課題を引き起こす。
これらの制約を克服するため,低解像度ビデオから抽出した人間の骨格に基づいて,SDFAと呼ばれる転倒検出モデルを提案する。
スケルトンデータを使用することで、プライバシーが保証され、低解像度のビデオが低ハードウェアと計算コストを保証します。
本モデルでは,共有高次元空間上に投影される統一関節および運動特徴を用いて,識別的構造変位と動きの傾向を捉える。
特に、分離可能な畳み込みと強力なGCNアーキテクチャを組み合わせることで、パフォーマンスが向上する。
広範囲な評価設定を持つ5つの大規模データセットに対する大規模な実験により、我々のモデルは計算の複雑さが極端に低く、既存のモデルよりも高速に動作することを示す。
関連論文リスト
- Computer-Aided Fall Recognition Using a Three-Stream Spatial-Temporal GCN Model with Adaptive Feature Aggregation [0.5235143203977018]
転倒予防は現代医療において特に高齢者にとって最重要である。
高齢者の生活を救うためには,コンピュータ支援による転倒検知システムが不可欠である。
本稿では,3流時空間特徴量に基づく転倒検出システムを提案する。
論文 参考訳(メタデータ) (2024-08-22T08:40:04Z) - Towards Evaluating the Robustness of Visual State Space Models [63.14954591606638]
視覚状態空間モデル(VSSM)は視覚知覚タスクにおいて顕著な性能を示した。
しかし、自然と敵対的な摂動の下での頑丈さは依然として重要な懸念事項である。
様々な摂動シナリオ下でのVSSMの頑健さを総合的に評価する。
論文 参考訳(メタデータ) (2024-06-13T17:59:44Z) - A Reliable Framework for Human-in-the-Loop Anomaly Detection in Time Series [17.08674819906415]
HILADは、人間とAIの動的かつ双方向なコラボレーションを促進するために設計された、新しいフレームワークである。
ビジュアルインターフェースを通じて、HILADはドメインの専門家に、大規模な予期せぬモデルの振る舞いを検出し、解釈し、修正する権限を与えます。
論文 参考訳(メタデータ) (2024-05-06T07:44:07Z) - XAI-based gait analysis of patients walking with Knee-Ankle-Foot
orthosis using video cameras [1.8749305679160366]
本稿では,カメラの動きに頑健な歩行解析システムを提案する。
提案システムは,前処理時に超解像とポーズ推定を用いる。
次に、ストライド長、ステップ長、フォーメーションの7つの特徴、正統および非正統の脚、ケイデンス、スピードの単独サポートを識別する。
論文 参考訳(メタデータ) (2024-02-25T19:05:10Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - Coherent Loss: A Generic Framework for Stable Video Segmentation [103.78087255807482]
ビデオセグメンテーションの結果の視覚的品質を,ジッタリングアーティファクトがいかに劣化させるかを検討する。
本稿では,ニューラルネットワークの性能向上を目的とした汎用フレームワークを備えたコヒーレントロスを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:48:28Z) - Low to High Dimensional Modality Hallucination using Aggregated Fields
of View [48.32515709424962]
我々は、モダリティ幻覚を一貫したモダリティ可用性を保証する効果的な方法として論じる。
本稿では,周辺地域の複数の分野から情報を集約する新しい幻覚アーキテクチャを提案する。
また、UWRGBDおよびNYUDデータセットの分類とセグメンテーション実験を行い、幻覚がモダリティ損失の負の影響を和らげることを示した。
論文 参考訳(メタデータ) (2020-07-13T03:13:48Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。