論文の概要: LDTrack: Dynamic People Tracking by Service Robots using Diffusion
Models
- arxiv url: http://arxiv.org/abs/2402.08774v2
- Date: Mon, 26 Feb 2024 22:46:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 20:57:08.255628
- Title: LDTrack: Dynamic People Tracking by Service Robots using Diffusion
Models
- Title(参考訳): LDTrack:拡散モデルを用いたサービスロボットによる動的人物追跡
- Authors: Angus Fung, Beno Benhabib, Goldie Nejat
- Abstract要約: 本稿では、条件付き潜伏拡散モデル(LDTrack)を用いて、複数の動的人物をクラス内変動下で追跡する新しいディープラーニングアーキテクチャを提案する。
我々は,高次元の潜伏空間内での拡散処理を可能にする潜在特徴エンコーダネットワークを導入し,人物の外観,動き,位置,アイデンティティ,文脈情報などのリッチな特徴の抽出と時間的改善を可能にする。
- 参考スコア(独自算出の注目度): 6.798578739481274
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking of dynamic people in cluttered and crowded human-centered
environments is a challenging robotics problem due to the presence of
intraclass variations including occlusions, pose deformations, and lighting
variations. This paper introduces a novel deep learning architecture, using
conditional latent diffusion models, the Latent Diffusion Track (LDTrack), for
tracking multiple dynamic people under intraclass variations. By uniquely
utilizing conditional latent diffusion models to capture temporal person
embeddings, our architecture can adapt to appearance changes of people over
time. We incorporated a latent feature encoder network which enables the
diffusion process to operate within a high-dimensional latent space to allow
for the extraction and spatial-temporal refinement of such rich features as
person appearance, motion, location, identity, and contextual information.
Extensive experiments demonstrate the effectiveness of LDTrack over other
state-of-the-art tracking methods in cluttered and crowded human-centered
environments under intraclass variations. Namely, the results show our method
outperforms existing deep learning robotic people tracking methods in both
tracking accuracy and tracking precision with statistical significance.
- Abstract(参考訳): 乱雑で混み合った人間中心の環境でのダイナミックな人々の追跡は、オクルージョン、ポーズ変形、照明のバリエーションなどクラス内変異が存在するため、ロボット工学の課題である。
本稿では,条件付き潜時拡散モデルである潜時拡散トラック(ldtrack)を用いて,クラス内変動下で複数の動的人物を追跡する新しいディープラーニングアーキテクチャを提案する。
条件付き潜在拡散モデルを利用して時間的人物の埋め込みを捉えることで、我々のアーキテクチャは時間とともに人の外観変化に対応できる。
我々は,高次元の潜伏空間内での拡散処理を可能にする潜在特徴エンコーダネットワークを導入し,人物の外観,動き,位置,アイデンティティ,文脈情報などの豊富な特徴の抽出と時間的改善を可能にする。
集団実験により, クラス内変動下での混在する人中心環境において, LDTrackの他の最先端追跡法に対する効果が示された。
すなわち,本手法は,統計的に有意な追跡精度と追跡精度の両方において,既存の深層学習ロボットよりも優れることを示す。
関連論文リスト
- Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.89014020303557]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - Spatiotemporal-Augmented Graph Neural Networks for Human Mobility
Simulation [30.723611607539176]
位置の動的時間的影響をモデル化する新しい枠組みを提案する。
このフレームワークは、行動対応を捉えるために様々な時間グラフを構築し、場所の様々な居住地をシミュレートする新しいブランチを構築している。
私たちのコードは公開されます。
論文 参考訳(メタデータ) (2023-06-15T11:47:45Z) - Learning Representative Trajectories of Dynamical Systems via
Domain-Adaptive Imitation [0.0]
ドメイン適応軌道模倣のための深層強化学習エージェントDATIを提案する。
実験の結果,DATIは模擬学習と最適制御のベースライン手法よりも優れていることがわかった。
実世界のシナリオへの一般化は、海上交通における異常な動きパターンの発見を通じて示される。
論文 参考訳(メタデータ) (2023-04-19T15:53:48Z) - Trace and Pace: Controllable Pedestrian Animation via Guided Trajectory
Diffusion [83.88829943619656]
本研究では,現実的な歩行者軌跡生成手法と,ユーザ定義目標を達成するために制御可能なフルボディアニメーションを提案する。
我々のガイド付き拡散モデルでは,対象とする経路,速度,特定社会集団による軌道の制約が可能である。
本稿では,アニメーションコントローラのRLトレーニング中に学習した値関数を用いて,拡散を誘導し,特定のシナリオに適した軌道を生成することを提案する。
論文 参考訳(メタデータ) (2023-04-04T15:46:42Z) - Predicting Human Mobility via Self-supervised Disentanglement Learning [21.61423193132924]
本稿では,次のPOI予測問題に対処するため,SSDLと呼ばれる新しい解を提案する。
本研究では,人間の本質的な周期性と常に変化する意図の理解を高めるために,二つの現実的な軌道拡張手法を提案する。
4つの実世界のデータセットで実施された大規模な実験により、提案したSSDLは最先端のアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-11-17T16:17:22Z) - MILD: Multimodal Interactive Latent Dynamics for Learning Human-Robot
Interaction [34.978017200500005]
我々は,HRI(Human-Robot Interactions)の問題に対処するために,MILD(Multimodal Interactive Latent Dynamics)を提案する。
変分オートエンコーダ(VAE)の潜時空間における相互作用エージェントの結合分布をモデル化するために,Hidden Semi-Markov Models (HSMMs) を用いて実演から相互作用ダイナミクスを学習する。
MILDは、観察されたエージェント(人間の)軌道に条件付けされたときに、制御されたエージェント(ロボット)に対してより正確な軌道を生成する。
論文 参考訳(メタデータ) (2022-10-22T11:25:11Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Transformer Inertial Poser: Attention-based Real-time Human Motion
Reconstruction from Sparse IMUs [79.72586714047199]
本研究では,6つのIMUセンサからリアルタイムに全体動作を再構築する,注意に基づく深層学習手法を提案する。
提案手法は, 実装が簡単で, 小型でありながら, 定量的かつ質的に新しい結果が得られる。
論文 参考訳(メタデータ) (2022-03-29T16:24:52Z) - Robots Autonomously Detecting People: A Multimodal Deep Contrastive
Learning Method Robust to Intraclass Variations [6.798578739481274]
本稿では,クラス内変動下での人検出の移動ロボット問題に対処する,新しいマルチモーダル人検出アーキテクチャを提案する。
本稿では,1)時間不変なマルチモーダルコントラスト学習(TimCLR)と,2)MFRCNN(Multimal Faster R-CNN)検出器を用いた2段階学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-01T02:36:17Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。