論文の概要: COMETH: Convex Optimization for Multiview Estimation and Tracking of Humans
- arxiv url: http://arxiv.org/abs/2508.20920v1
- Date: Thu, 28 Aug 2025 15:50:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:02.493496
- Title: COMETH: Convex Optimization for Multiview Estimation and Tracking of Humans
- Title(参考訳): COMETH:人間のマルチビュー推定と追跡のための凸最適化
- Authors: Enrico Martini, Ho Jin Choi, Nadia Figueroa, Nicola Bombieri,
- Abstract要約: リアルタイム多視点ヒューマンポーズ融合のための軽量アルゴリズムであるCOMETHを提案する。
我々は、COMETHをパブリックデータセットと産業データセットの両方で評価し、ローカライゼーション、検出、追跡の精度において最先端の手法より優れています。
提案した融合パイプラインは、正確でスケーラブルな人間のモーショントラッキングを可能にし、産業用および安全上重要なアプリケーションに適している。
- 参考スコア(独自算出の注目度): 18.465149535311753
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the era of Industry 5.0, monitoring human activity is essential for ensuring both ergonomic safety and overall well-being. While multi-camera centralized setups improve pose estimation accuracy, they often suffer from high computational costs and bandwidth requirements, limiting scalability and real-time applicability. Distributing processing across edge devices can reduce network bandwidth and computational load. On the other hand, the constrained resources of edge devices lead to accuracy degradation, and the distribution of computation leads to temporal and spatial inconsistencies. We address this challenge by proposing COMETH (Convex Optimization for Multiview Estimation and Tracking of Humans), a lightweight algorithm for real-time multi-view human pose fusion that relies on three concepts: it integrates kinematic and biomechanical constraints to increase the joint positioning accuracy; it employs convex optimization-based inverse kinematics for spatial fusion; and it implements a state observer to improve temporal consistency. We evaluate COMETH on both public and industrial datasets, where it outperforms state-of-the-art methods in localization, detection, and tracking accuracy. The proposed fusion pipeline enables accurate and scalable human motion tracking, making it well-suited for industrial and safety-critical applications. The code is publicly available at https://github.com/PARCO-LAB/COMETH.
- Abstract(参考訳): 産業5.0の時代には、人間活動の監視は人間工学的安全性と全体的な健康の確保に不可欠である。
マルチカメラの集中的なセットアップは推定精度を向上させるが、しばしば高い計算コストと帯域幅の要求に悩まされ、スケーラビリティとリアルタイム適用性が制限される。
エッジデバイス間での分散処理は、ネットワーク帯域幅と計算負荷を減らすことができる。
一方、エッジデバイスの制約されたリソースは精度を低下させ、計算の分布は時間的および空間的不整合をもたらす。
我々はCOMETH (Convex Optimization for Multiview Estimation and Tracking of Humans) というリアルタイム多視点ヒューマンポーズ融合のための軽量なアルゴリズムを提案し、これは3つの概念に依存している: 関節位置決め精度を向上させるために運動力学的および生体力学的制約を統合する; 空間融合のために凸最適化に基づく逆運動学を採用し、状態オブザーバを実装して時間的一貫性を向上させる。
我々は、COMETHをパブリックデータセットと産業データセットの両方で評価し、ローカライゼーション、検出、追跡の精度において最先端の手法より優れています。
提案した融合パイプラインは、正確でスケーラブルな人間のモーショントラッキングを可能にし、産業用および安全上重要なアプリケーションに適している。
コードはhttps://github.com/PARCO-LAB/COMETHで公開されている。
関連論文リスト
- Optimization of DNN-based HSI Segmentation FPGA-based SoC for ADS: A Practical Approach [1.474723404975345]
本研究では,FPGA ベースの SOC 上にデプロイされた DNN ベースの HSI セグメンテーションプロセッサの実用的共同設計のための最適化手法を提案する。
応用圧縮技術により設計されたDNNの複雑さは、元の操作の24.34%、元のパラメータの1.02%に大幅に減少し、セグメンテーション精度を著しく低下させることなく、推論タスクの2.86倍のスピードアップを達成した。
論文 参考訳(メタデータ) (2025-07-22T13:09:04Z) - ZIA: A Theoretical Framework for Zero-Input AI [0.0]
Zero-Input AI(ZIA)は、明示的なユーザコマンドを使わずに、積極的な意図予測を可能にすることによって、人間とコンピュータのインタラクションのための新しいフレームワークを導入している。
リアルタイム推論のためのマルチモーダルモデルに、視線追跡、バイオシグナル(EEG、心拍数)、コンテキストデータ(時間、位置、使用履歴)を統合する。
ZIAは、アクセシビリティ、ヘルスケア、消費者アプリケーションのためのスケーラブルでプライバシ保護フレームワークを提供し、AIを予測知性に向けて前進させる。
論文 参考訳(メタデータ) (2025-02-22T07:42:05Z) - ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - MASS: Mobility-Aware Sensor Scheduling of Cooperative Perception for
Connected Automated Driving [19.66714697653504]
コラボレーティブ・パーセプション(CP)と呼ばれる新しいパラダイムが、コラボレーティブ・ビークル(CoV)からのセンサデータを共有することで救助にやってくる。
既存の方法は、近くの車両からの知覚の利得を予測するために、可視性マップのようなメタ情報交換に依存している。
CPの分散スケジューリングにおいて,スケジューリング中に学習する新しい手法を提案する。
提案したMASSアルゴリズムは,他の学習ベースアルゴリズムと比較して,最大4.2ポイントのリコール率向上を実現している。
論文 参考訳(メタデータ) (2023-02-25T09:03:05Z) - Resource Allocation of Federated Learning for the Metaverse with Mobile
Augmented Reality [13.954907748381743]
モバイル拡張現実(MAR)によるメタバースアプリケーションは、デジタルデータを現実世界と混在させるために、迅速かつ正確なオブジェクト検出を必要とする。
フェデレートラーニング(FL)は、プライバシ保護の特性から興味深い分散機械学習アプローチである。
本稿では,全エネルギー消費,完了時間,モデル精度の重み付けを最小化するために最適化問題を定式化する。
論文 参考訳(メタデータ) (2022-11-16T06:37:32Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - An automatic differentiation system for the age of differential privacy [65.35244647521989]
Tritiumは、微分プライベート(DP)機械学習(ML)のための自動微分ベース感度分析フレームワークである
我々は、微分プライベート(DP)機械学習(ML)のための自動微分に基づく感度分析フレームワークTritiumを紹介する。
論文 参考訳(メタデータ) (2021-09-22T08:07:42Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。