論文の概要: Body and Head Orientation Estimation from Low-Resolution Point Clouds in Surveillance Settings
- arxiv url: http://arxiv.org/abs/2311.00343v2
- Date: Mon, 30 Sep 2024 22:17:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-02 16:32:45.298241
- Title: Body and Head Orientation Estimation from Low-Resolution Point Clouds in Surveillance Settings
- Title(参考訳): サーベイランス環境における低解像度点雲からの体と頭部の向き推定
- Authors: Onur N. Tepencelik, Wenchuan Wei, Pamela C. Cosman, Sujit Dey,
- Abstract要約: 2つのLiDARセンサの低分解能点雲データを用いて人の身体と頭部の向きを推定するシステムを提案する。
我々のモデルは、テーブルの周りに座ったまま、被験者が様々な頭と体のポーズで自然に移動する現実世界の会話環境において正確な推定を行う。
また、三進的(三進的)会話における神経型と自閉症者の行動差を定量化して、頭部方向推定の適用について述べる。
- 参考スコア(独自算出の注目度): 8.043273571543805
- License:
- Abstract: We propose a system that estimates people's body and head orientations using low-resolution point cloud data from two LiDAR sensors. Our models make accurate estimations in real-world conversation settings where subjects move naturally with varying head and body poses, while seated around a table. The body orientation estimation model uses ellipse fitting while the head orientation estimation model combines geometric feature extraction with an ensemble of neural network regressors. Our models achieve a mean absolute estimation error of 5.2 degrees for body orientation and 13.7 degrees for head orientation. Compared to other body/head orientation estimation systems that use RGB cameras, our proposed system uses LiDAR sensors to preserve user privacy, while achieving comparable accuracy. Unlike other body/head orientation estimation systems, our sensors do not require a specified close-range placement in front of the subject, enabling estimation from a surveillance viewpoint which produces low-resolution data. This work is the first to attempt head orientation estimation using point clouds in a low-resolution surveillance setting. We compare our model to two state-of-the-art head orientation estimation models that are designed for high-resolution point clouds, which yield higher estimation errors on our low-resolution dataset. We also present an application of head orientation estimation by quantifying behavioral differences between neurotypical and autistic individuals in triadic (three-way) conversations. Significance tests show that autistic individuals display significantly different behavior compared to neurotypical individuals in distributing attention between conversational parties, suggesting that the approach could be a component of a behavioral analysis or coaching system.
- Abstract(参考訳): 2つのLiDARセンサの低分解能点雲データを用いて人の身体と頭部の向きを推定するシステムを提案する。
我々のモデルは、テーブルの周りに座ったまま、被験者が様々な頭と体のポーズで自然に移動する現実世界の会話環境において正確な推定を行う。
身体配向推定モデルは楕円フィッティングを使用し、頭部配向推定モデルは幾何学的特徴抽出とニューラルネットワーク回帰器のアンサンブルを組み合わせる。
本モデルでは, 平均絶対誤差は体向き5.2度, 頭部向き13.7度である。
RGBカメラを用いた他のボディー/ヘッドオリエンテーション推定システムと比較して、提案システムはLiDARセンサを用いてユーザのプライバシを保ちながら、同等の精度を実現している。
他の身体/頭部方向推定システムとは異なり、我々のセンサーは被写体の前に特定の近距離配置を必要としないため、低解像度データを生成する監視視点から推定することが可能である。
この研究は、低解像度の監視環境で点雲を用いた方位推定を試みた最初の試みである。
我々は、高分解能点雲用に設計された2つの最先端ヘッドオリエンテーション推定モデルと比較し、低分解能データセット上で高い推定誤差をもたらす。
また、三進的(三進的)会話における神経型と自閉症者の行動差を定量化して、頭部方向推定の適用について述べる。
有意なテストでは、自閉症の個人は、会話相手間の注意を分散する神経型個体と比較して、行動分析やコーチングシステムの構成要素である可能性が示唆された。
関連論文リスト
- Estimating Body and Hand Motion in an Ego-sensed World [64.08911275906544]
頭部装着装置から人体の動きを推定するシステムであるEgoAlloについて述べる。
エゴセントリックなSLAMポーズとイメージのみを使用して、EgoAlloは条件付き拡散モデルからサンプリングを行い、3Dボディポーズ、高さ、手のパラメータを推定する。
論文 参考訳(メタデータ) (2024-10-04T17:59:57Z) - SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - PhyOT: Physics-informed object tracking in surveillance cameras [0.2633434651741688]
深層ニューラルネットワークをセンサとして概念化するハイブリッドモデル(PhyOT)について検討する。
実験では,3つのニューラルネットワーク,動作位置,間接速度,加速度推定をそれぞれ組み合わせて,その定式化を2つのベンチマークデータセットで評価した。
結果は、我々のPhyOTが最先端のディープニューラルネットワークが失敗する極端な条件下で物体を追跡することを示唆している。
論文 参考訳(メタデータ) (2023-12-14T04:15:55Z) - Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - IDOL: Inertial Deep Orientation-Estimation and Localization [18.118289074111946]
多くのスマートフォンアプリケーションは、運動を感知するために慣性測定装置(IMU)を使用しているが、歩行者の局所化にこれらのセンサーを使用することは困難である。
近年,慣性航法の可能性が高まっている。
本稿では,まず端末の向きを推定し,次にデバイスの位置を推定するコモディティスマートフォンを用いた2段階のデータ駆動パイプラインを提案する。
論文 参考訳(メタデータ) (2021-02-08T06:41:47Z) - Dynamic Bayesian Approach for decision-making in Ego-Things [8.577234269009042]
本稿では,マルチセンサデータと特徴選択に基づく動的システムの異常検出手法を提案する。
成長型ニューラルガス(GNG)は、マルチセンサーデータを一連のノードにクラスタリングするために使用される。
本手法は状態推定と異常検出にマルコフジャンプ粒子フィルタ(MJPF)を用いる。
論文 参考訳(メタデータ) (2020-10-28T11:38:51Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。