論文の概要: ACRNet: Attention Cube Regression Network for Multi-view Real-time 3D
Human Pose Estimation in Telemedicine
- arxiv url: http://arxiv.org/abs/2210.05130v1
- Date: Tue, 11 Oct 2022 04:08:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 17:12:43.876278
- Title: ACRNet: Attention Cube Regression Network for Multi-view Real-time 3D
Human Pose Estimation in Telemedicine
- Title(参考訳): ACRNet:遠隔医療における多視点リアルタイム3次元人物位置推定のための注意キューブ回帰ネットワーク
- Authors: Boce Hu, Chenfei Zhu, Xupeng Ai and Sunil K. Agrawal
- Abstract要約: マルチビューアテンションキューブ回帰ネットワーク(ACRNet)を提案する。
ACRNetは、各立方体表面に情報的注意点を集約することにより、継手の3次元位置をリアルタイムで後退させる。
精度が高く,実行速度が高いため,リアルタイム遠隔医療環境に適したモデルである。
- 参考スコア(独自算出の注目度): 6.509265251405064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation (HPE) for 3D skeleton reconstruction in telemedicine
has long received attention. Although the development of deep learning has made
HPE methods in telemedicine simpler and easier to use, addressing low accuracy
and high latency remains a big challenge. In this paper, we propose a novel
multi-view Attention Cube Regression Network (ACRNet), which regresses the 3D
position of joints in real time by aggregating informative attention points on
each cube surface. More specially, a cube whose each surface contains uniformly
distributed attention points with specific coordinate values is first created
to wrap the target from the main view. Then, our network regresses the 3D
position of each joint by summing and averaging the coordinates of attention
points on each surface after being weighted. To verify our method, we first
tested ACRNet on the open-source ITOP dataset; meanwhile, we collected a new
multi-view upper body movement dataset (UBM) on the trunk support trainer
(TruST) to validate the capability of our model in real rehabilitation
scenarios. Experimental results demonstrate the superiority of ACRNet compared
with other state-of-the-art methods. We also validate the efficacy of each
module in ACRNet. Furthermore, Our work analyzes the performance of ACRNet
under the medical monitoring indicator. Because of the high accuracy and
running speed, our model is suitable for real-time telemedicine settings. The
source code is available at https://github.com/BoceHu/ACRNet
- Abstract(参考訳): 遠隔医療における3次元骨格再構築のためのhpe(human pose estimation)が注目されている。
ディープラーニングの開発により、遠隔医療におけるHPEの手法はシンプルで使いやすくなっているが、低い精度と高いレイテンシに対処することは大きな課題である。
本稿では,各立方体表面に情報的注意点を集約することにより,関節の3次元位置をリアルタイムに再現する多視点立方体回帰ネットワーク(ACRNet)を提案する。
より具体的には、各面が特定の座標値を持つ均一に分散された注意点を含む立方体が最初に作成され、ターゲットをメインビューからラップする。
そして,重み付け後の各面の注目点の座標を和算し,平均化することにより,各関節の3次元位置を復元する。
提案手法を検証するため,オープンソースITOPデータセット上でACRNetを最初にテストし,また,トランクサポートトレーナー(TruST)上に新しい多視点上体運動データセット(UBM)を収集し,実際のリハビリテーションシナリオにおけるモデルの有効性を検証する。
実験の結果, acrnetは他の最先端手法と比較して優れていることがわかった。
また,ACRNetにおける各モジュールの有効性を検証する。
さらに,医療モニタリング指標に基づくACRNetの性能分析を行った。
精度が高く,実行速度が高いため,リアルタイム遠隔医療環境に適したモデルである。
ソースコードはhttps://github.com/BoceHu/ACRNetで入手できる。
関連論文リスト
- Improved distinct bone segmentation in upper-body CT through
multi-resolution networks [0.39583175274885335]
上半身CTと異なる骨分画では、大きな視野と計算的な3Dアーキテクチャが必要とされる。
これにより、空間的コンテキストの欠如により、細部や局所的な誤差を欠いた低解像度な結果が得られる。
本稿では,異なる解像度で動作する複数の3次元U-Netを組み合わせたエンドツーエンドのトレーニング可能なセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2023-01-31T14:46:16Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - SSP-Net: Scalable Sequential Pyramid Networks for Real-Time 3D Human
Pose Regression [27.85790535227085]
高速でスケーラブルな畳み込みニューラルネットワークを,静止RGB画像からのリアルタイムな3次元ポーズ回帰のために提案する。
我々のネットワークは1つのトレーニング手順を必要とし、最高の予測を毎秒120フレームで作成することができる。
論文 参考訳(メタデータ) (2020-09-04T03:43:24Z) - Monocular 3D Detection with Geometric Constraints Embedding and
Semi-supervised Training [3.8073142980733]
我々は,KM3D-Netと呼ばれる,RGB画像のみを用いたモノクル3Dオブジェクト検出のための新しいフレームワークを提案する。
我々は、対象のキーポイント、次元、方向を予測するための完全な畳み込みモデルを設計し、これらの推定を視点幾何学的制約と組み合わせて位置属性を計算する。
論文 参考訳(メタデータ) (2020-09-02T00:51:51Z) - HDNet: Human Depth Estimation for Multi-Person Camera-Space Localization [83.57863764231655]
本稿では,根の絶対的局所化のためのエンドツーエンドフレームワークであるHuman Depth Estimation Network (HDNet)を提案する。
関節間の特徴伝達に骨格ベースのグラフニューラルネットワーク(GNN)を用いる。
我々は,2つのベンチマークデータセットを用いて,ルートジョイントローカライゼーションとルート相対的な3次元ポーズ推定タスクについて,HDNetの評価を行った。
論文 参考訳(メタデータ) (2020-07-17T12:44:23Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z) - Joint Spatial-Temporal Optimization for Stereo 3D Object Tracking [34.40019455462043]
本研究では,空間時間最適化に基づくステレオ3次元物体追跡手法を提案する。
ネットワークから隣接画像上の対応する2Dバウンディングボックスを検出し,初期3Dバウンディングボックスを回帰する。
オブジェクトセントロイドに関連づけられた複雑なオブジェクトキューは、リージョンベースのネットワークを使用して予測される。
論文 参考訳(メタデータ) (2020-04-20T13:59:46Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z) - Learning 3D Human Shape and Pose from Dense Body Parts [117.46290013548533]
本研究では,3次元の人体形状を学習し,身体部分の密接な対応からポーズをとるために,分解・集約ネットワーク(DaNet)を提案する。
ローカルストリームからのメッセージは集約され、回転ベースのポーズの堅牢な予測が強化される。
提案手法は,Human3.6M,UP3D,COCO,3DPWを含む屋内および実世界のデータセットで検証される。
論文 参考訳(メタデータ) (2019-12-31T15:09:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。