Fugu-MT 論文翻訳(概要): Stereo Vision-Based Fall Prediction and Detection using Human Pose Estimation on the AMD Kria K26 SOM

論文の概要: Stereo Vision-Based Fall Prediction and Detection using Human Pose Estimation on the AMD Kria K26 SOM

arxiv url: http://arxiv.org/abs/2606.12473v1
Date: Wed, 10 Jun 2026 05:08:35 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-12 15:55:27.347385
Title: Stereo Vision-Based Fall Prediction and Detection using Human Pose Estimation on the AMD Kria K26 SOM
Title（参考訳）: AMD Kria K26 SOMを用いた立体視による転倒予測と人文推定による検出
Authors: Shreyas Narasimhiah Ramesh, P. D. Rathika, Mahasweta Sarkar, Kristen Wells, Michel Audette, Christopher Paolini,
Abstract要約: タイムリーな予測と検出は、害を防ぎ、幸福をサポートするために不可欠である。携帯型,低消費電力,バッテリ操作,視覚に基づく転倒予測・検出システムを提案する。目的は、リアルタイムの転倒検出のための、侵入的でないプライバシー保護システムである。
参考スコア（独自算出の注目度）: 0.12314765641075437
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Background and Objective: Falls among elderly people can cause serious injury and reduce quality of life. Timely prediction and detection are essential to prevent harm and support well-being. We propose a portable, low-power, battery-operated, vision-based fall prediction and detection system using HPE on an AMD Kria K26 System-on-Module (SOM). The objective is a non-intrusive, privacy-preserving system for real-time fall detection. Methods: The system uses an Intel RealSense D455 range-sensing camera connected to the K26 SOM by USB. It captures synchronized RGB and depth frames, 640 x 480 x 3 and 640 x 480 pixels, at 60 FPS. The SOM runs a three-stage pipeline with quantized YOLOX, Anchor-to-Joint (A2J), and fall-detection models. YOLOX identifies human bounding boxes from RGB frames, then discards the RGB frames to preserve privacy. A2J uses depth frames to estimate 15 joint keypoints per person. A CNN uses selected joint coordinates (x, y, z) to classify fall activity. YOLOX was trained on CrowdHuman; A2J on ITOP, MP-3DHP, UR Fall Detection, and a custom SDSU PSG dataset; and the CNN on UR Fall Detection and SDSU PSG. The design used a single-core DPU with a serial pipeline and a dual-core DPU running YOLOX and A2J with multiple threads. Results: Quantized accuracy was evaluated using IoU >= 50% for YOLOX, mAP with a 10-cm rule for A2J, and classification accuracy, (TP + TN)/(TP + TN + FP + FN), for the CNN. Accuracies were 74%, 84.13%, and 75.85%. Throughput improved from 2.5 FPS for the single-threaded pipeline to 4.5 FPS for the multi-threaded version. Conclusion: Results demonstrate the feasibility of privacy-preserving fall detection on an AMD Kria K26 edge device. On-device HPE and fall classification runs without cloud dependency, supporting elderly monitoring and assistive healthcare. Future work will improve model accuracy and speed.
Abstract（参考訳）: 背景と目的:高齢者の転倒は重傷を負い、生活の質を低下させる。タイムリーな予測と検出は、害を防ぎ、幸福をサポートするために不可欠である。我々は,AMD Kria K26 System-on-Module (SOM)上で,HPEを用いた携帯型,低消費電力,電池駆動,視覚に基づく転倒予測・検出システムを提案する。目的は、リアルタイムの転倒検出のための、侵入的でないプライバシー保護システムである。方法:このシステムは、K26 SOMにUSBで接続されたIntel RealSense D455レンジセンサーカメラを使用する。 640 x 480 x 3と640 x 480ピクセルの同期RGBと奥行きフレームを60FPSで撮影する。 SOMは、量子化されたYOLOX、Anchor-to-Joint (A2J)、秋検出モデルを備えた3段階パイプラインを実行する。 YOLOXはRGBフレームから人間のバウンディングボックスを特定し、プライバシーを守るためにRGBフレームを破棄する。 A2Jはディープフレームを使用して、1人あたり15個のジョイントキーポイントを推定する。 CNNは、選択された関節座標(x, y, z)を用いて、転倒活動の分類を行う。 YOLOXは、CrowdHuman、ITOP、MP-3DHP、UR Fall Detection、カスタムSDSU PSGデータセットのA2J、UR Fall DetectionとSDSU PSGのCNNでトレーニングされた。この設計では、シリアルパイプラインを備えたシングルコアDPUと、複数のスレッドでYOLOXとA2Jを実行するデュアルコアDPUが使用された。結果:YOLOXではIoU >=50%,A2Jでは10cmルールのmAP,CNNでは(TP + TN)/(TP + TN + FP + FN)の分類精度が評価された。死亡率は74%、84.13%、75.85%であった。スループットはシングルスレッドパイプラインで2.5FPSからマルチスレッドバージョンで4.5FPSに改善された。結論: AMD Kria K26エッジデバイス上でのプライバシ保護による転倒検出の可能性を示す。デバイス上のHPEと秋の分類は、クラウド依存なしに実行され、高齢者の監視と補助医療をサポートする。今後の作業は、モデルの精度とスピードを改善するだろう。

関連論文リスト

Intrusion Detection on Resource-Constrained IoT Devices with Hardware-Aware ML and DL [3.218984853261389]
本稿では,IoT(Internet of Things)ネットワークとIoT(Industrial IoT)ネットワークのためのハードウェア対応侵入検知システム(IDS)を提案する。分類が高速、プライバシ保護、リソース効率の高い脅威検出に不可欠であるシナリオをターゲットにしている。目標は、厳格なエッジデバイス制約の中で、ツリーベース機械学習(ML)モデルとコンパクトディープニューラルネットワーク(DNN)の両方を最適化することだ。
論文参考訳（メタデータ） (2025-12-01T23:36:03Z)
A Comprehensive Evaluation of YOLO-based Deer Detection Performance on Edge Devices [6.486957474966142]
鹿の侵入による農業の経済的損失は、アメリカで毎年数億ドルに上っていると推定され、伝統的な緩和戦略の不適切さを浮き彫りにした。このことは、リアルタイムの鹿検出と抑止能力を持つインテリジェントで自律的なソリューションに対する重要なニーズを浮き彫りにしている。本研究では,シカ検出のための最先端深層学習モデルの総合的評価を行う。
論文参考訳（メタデータ） (2025-09-24T17:01:50Z)
Rapid Salient Object Detection with Difference Convolutional Neural Networks [49.838283141381716]
本稿では,資源制約のあるデバイスにSODをリアルタイムに展開する上での課題について述べる。 SODにおける従来の知恵と現代のCNNの表現力を組み合わせたネットワーク設計を提案する。
論文参考訳（メタデータ） (2025-07-01T20:41:05Z)
YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文参考訳（メタデータ） (2023-08-10T10:12:27Z)
Collaboration Helps Camera Overtake LiDAR in 3D Detection [49.58433319402405]
カメラのみの3D検出は、LiDARベースの検出システムと比較して、オブジェクトを3D空間にローカライズするための簡単なソリューションを提供する。提案するコラボレーティブカメラのみの3D検出(CoCa3D)により,エージェントは通信を通じて相互に補完情報を共有できる。その結果、CoCa3Dは従来のSOTA性能をDAIR-V2Xで44.21%改善し、OPV2V+で30.60%、AP@70でCoPerception-UAVs+で12.59%向上した。
論文参考訳（メタデータ） (2023-03-23T03:50:41Z)
EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文参考訳（メタデータ） (2023-02-15T06:05:14Z)
Developing a Compressed Object Detection Model based on YOLOv4 for Deployment on Embedded GPU Platform of Autonomous System [0.0]
CNNベースのオブジェクト検出モデルは極めて正確だが、リアルタイムに実行するには高性能なGPUが必要である。検出精度を維持しつつ、検出ネットワークをできるだけ軽量に圧縮することが好ましい。本稿では,ハイ比で圧縮されたYOffleNetと呼ばれる新しい物体検出モデルを提案する。
論文参考訳（メタデータ） (2021-08-01T08:19:51Z)
Workshop on Autonomous Driving at CVPR 2021: Technical Report for Streaming Perception Challenge [57.647371468876116]
本稿では,現実的な自律運転シナリオのためのリアルタイム2次元物体検出システムについて紹介する。私たちの検出器は、YOLOXと呼ばれる新しい設計のYOLOモデルで構築されています。 Argoverse-HDデータセットでは,検出のみのトラック/トラックで2位を7.8/6.1上回る41.0ストリーミングAPを達成した。
論文参考訳（メタデータ） (2021-07-27T06:36:06Z)
Fast Motion Understanding with Spatiotemporal Neural Networks and Dynamic Vision Sensors [99.94079901071163]
本稿では,高速な動きを推論するための動的視覚センサ(DVS)システムを提案する。ロボットが15m/s以上の速度で接近する小さな物体に反応するケースを考察する。我々は,23.4m/sで24.73degの誤差を$theta$,18.4mmの平均離散半径予測誤差,衝突予測誤差に対する25.03%の中央値で移動した玩具ダートについて,本システムの結果を強調した。
論文参考訳（メタデータ） (2020-11-18T17:55:07Z)
Monitoring COVID-19 social distancing with person detection and tracking via fine-tuned YOLO v3 and Deepsort techniques [3.6016022712620095]
新型コロナウイルス感染症(COVID-19)は世界的な危機を引き起こしており、死者は180カ国以上で拡大している。ソーシャルディスタンシングは、このパンデミックと戦うための唯一の実現可能なアプローチだ。本稿では,監視ビデオを用いたソーシャルディスタンシングの監視作業を自動化するためのディープラーニングベースのフレームワークを提案する。
論文参考訳（メタデータ） (2020-05-04T10:58:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。