論文の概要: CPU Optimization of a Monocular 3D Biomechanics Pipeline for Low-Resource Deployment
- arxiv url: http://arxiv.org/abs/2604.15665v1
- Date: Fri, 17 Apr 2026 03:39:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.724736
- Title: CPU Optimization of a Monocular 3D Biomechanics Pipeline for Low-Resource Deployment
- Title(参考訳): 低リソース展開のための単分子3次元バイオメカニクスパイプラインのCPU最適化
- Authors: Yan Zhang, Xiong Zhao,
- Abstract要約: 単眼ビデオからのマーカーレス3D運動解析は,臨床およびスポーツ環境での生体力学的評価を可能にする。
そこで本研究では,モノキュラーバイオメカニクスフレームワークから派生したモノキュラー3Dパイプラインを最適化し,CPUのみの効率的な実行を実現する。
- 参考スコア(独自算出の注目度): 3.1137403061450732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Markerless 3D movement analysis from monocular video enables accessible biomechanical assessment in clinical and sports settings. However, most research-grade pipelines rely on GPU acceleration, limiting deployment on consumer-grade hardware and in low-resource environments. In this work, we optimize a monocular 3D biomechanics pipeline derived from the MonocularBiomechanics framework for efficient CPU-only execution. Through profiling-driven system optimization, including model initialization restructuring, elimination of disk I/O serialization, and improved CPU parallelization. Experiments on a consumer workstation (AMD Ryzen 7 9700X CPU) show a 2.47x increase in processing throughput and a 59.6\% reduction in total runtime, with initialization latency reduced by 4.6x. Despite these changes, biomechanical outputs remain highly consistent with the baseline implementation (mean joint-angle deviation 0.35$^\circ$, $r=0.998$). These results demonstrate that research-grade vision-based biomechanics pipelines can be deployed on commodity CPU hardware for scalable movement assessment.
- Abstract(参考訳): 単眼ビデオからのマーカーレス3D運動解析は,臨床およびスポーツ環境での生体力学的評価を可能にする。
しかしながら、ほとんどの研究グレードパイプラインはGPUアクセラレーションに依存しており、コンシューマグレードのハードウェアや低リソース環境へのデプロイメントを制限している。
そこで本研究では,モノキュラーバイオメカニクスフレームワークから派生したモノキュラー3次元バイオメカニクスパイプラインを最適化し,CPUのみの効率的な実行を実現する。
モデル初期化再構成、ディスクI/Oシリアライゼーションの排除、CPU並列化の改善など、プロファイリング駆動システム最適化によって実現された。
コンシューマー向けワークステーション(AMD Ryzen 7 9700X CPU)の実験では、処理スループットが2.47倍に向上し、全実行時の59.6\%が削減され、初期化遅延は4.6倍削減された。
これらの変化にもかかわらず、バイオメカニカルアウトプットはベースラインの実装と強く一致している(結合角偏差 0.35$^\circ$, $r=0.998$)。
これらの結果から,リサーチグレードの視覚に基づくバイオメカニクスパイプラインをコモディティCPUハードウェア上に展開して,スケーラブルな動作評価を行うことが可能であることが示唆された。
関連論文リスト
- ReconPhys: Reconstruct Appearance and Physical Attributes from Single Video [51.2815592637053]
ReconPhysは、単一の単眼ビデオから物理的属性推定と3次元ガウススプラッティング再構成を共同で学習するフィードフォワードフレームワークである。
提案手法では, 自己教師型戦略を用いて訓練したデュアルブランチアーキテクチャを用いて, 地上の物理ラベルの必要性を解消する。
大規模合成データセットの実験は優れた性能を示した。
論文 参考訳(メタデータ) (2026-04-09T06:51:14Z) - OpenCap Monocular: 3D Human Kinematics and Musculoskeletal Dynamics from a Single Smartphone Video [0.2012293145190529]
人の動き(キネマティックス)と筋骨格力(キネマティックス)の定量化は、モビリティ関連条件の予測、治療、監視を変革する可能性がある。
我々は,1台のスマートフォンビデオから3次元骨格運動学と運動学を推定するアルゴリズムであるOpenCap Monocularを紹介する。
論文 参考訳(メタデータ) (2026-03-25T18:56:46Z) - Stereo-Inertial Poser: Towards Metric-Accurate Shape-Aware Motion Capture Using Sparse IMUs and a Single Stereo Camera [54.967647497048205]
本稿では,距離精度と形状を考慮した3次元動作を推定するリアルタイムモーションキャプチャシステムであるStereo-Inertial Poserを提案する。
モノクラーRGBをステレオビジョンに置き換え、直接3次元キーポイント抽出と形状パラメータ推定を可能にした。
ドリフトフリーなグローバル翻訳を長い記録時間で生成し,フットスケート効果を低減させる。
論文 参考訳(メタデータ) (2026-03-02T17:46:38Z) - NeuroScalar: A Deep Learning Framework for Fast, Accurate, and In-the-Wild Cycle-Level Performance Prediction [18.863968099669364]
本稿では,生産ハードウェア上での高忠実なインザワイルドシミュレーションのための新しいディープラーニングフレームワークを提案する。
我々のコアコントリビューションは、仮説プロセッサ設計のためのサイクルレベルの性能を予測するために、マイクロアーキテクチャに依存しない機能に基づいて訓練されたDLモデルである。
このフレームワークは,大規模なハードウェアA/Bテストと正確な性能解析を可能にすることを実証する。
論文 参考訳(メタデータ) (2025-09-26T14:36:06Z) - Towards Deterministic End-to-end Latency for Medical AI Systems in
NVIDIA Holoscan [0.35516599670943777]
医療機器メーカーは、単一のプラットフォームに複数のアプリケーションを統合することで、AIとMLがもたらすメリットを最大化することを熱望している。
複数のAIアプリケーションの同時実行は、それぞれ独自の視覚化コンポーネントを持ち、予測不可能なエンドツーエンドのレイテンシをもたらす。
本稿では,センサデータと画像のストリーミングを行うリアルタイムAIシステムであるHoloscanプラットフォームにおけるこれらの課題に対処する。
論文 参考訳(メタデータ) (2024-02-06T23:20:34Z) - DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures
using Lookup Tables [49.965024476651706]
DeepGEMMはSIMDハードウェア上で超高精度畳み込みニューラルネットワークを実行するためのルックアップテーブルベースのアプローチである。
実装は、x86プラットフォーム上で、対応する8ビット整数カーネルを最大1.74倍の性能で上回る。
論文 参考訳(メタデータ) (2023-04-18T15:13:10Z) - Markerless Motion Capture and Biomechanical Analysis Pipeline [0.0]
マーカーレスモーションキャプチャーは、正確な動き分析へのアクセスを拡大する可能性がある。
当パイプラインでは,リハビリテーション病院における運動の正確なバイオメカニカル推定値の取得が容易である。
論文 参考訳(メタデータ) (2023-03-19T13:31:57Z) - MAPLE: Microprocessor A Priori for Latency Estimation [81.91509153539566]
現代のディープニューラルネットワークは、低レイテンシとエネルギー消費を示しながら最先端の精度を示す必要がある。
評価されたアーキテクチャのレイテンシの測定は、NASプロセスにかなりの時間を加えます。
転送学習やドメイン適応に依存しない推定用マイクロプロセッサAプライオリティを提案する。
論文 参考訳(メタデータ) (2021-11-30T03:52:15Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Sample Factory: Egocentric 3D Control from Pixels at 100000 FPS with
Asynchronous Reinforcement Learning [68.2099740607854]
サンプルファクトリー(Sample Factory)は、シングルマシン設定に最適化された高スループットトレーニングシステムである。
我々のアーキテクチャは、非常に効率的で非同期なGPUベースのサンプリングと、オフポリシー補正技術を組み合わせています。
我々は,Sample Factoryを拡張して,セルフプレイと人口ベーストレーニングをサポートし,これらのテクニックを多人数一対一シューティングゲームのための高度なエージェントの訓練に応用する。
論文 参考訳(メタデータ) (2020-06-21T10:00:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。