Fugu-MT 論文翻訳(概要): HumanFlow -- Diffusion-Driven MAV Navigation Among Humans via Tightly-Coupled Motion Tracking, Forecasting, and Control

論文の概要: HumanFlow -- Diffusion-Driven MAV Navigation Among Humans via Tightly-Coupled Motion Tracking, Forecasting, and Control

arxiv url: http://arxiv.org/abs/2605.25685v1
Date: Mon, 25 May 2026 10:40:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 19:50:19.743283
Title: HumanFlow -- Diffusion-Driven MAV Navigation Among Humans via Tightly-Coupled Motion Tracking, Forecasting, and Control
Title（参考訳）: HumanFlow -- 高度結合型モーショントラッキング、予測、制御による人体間の拡散駆動型MAVナビゲーション
Authors: Simon Schaefer, Joshua Näf, Stefan Leutenegger,
Abstract要約: 我々は人間の動きの追跡と予測を統一する潜在拡散モデルであるHumanFlowを紹介する。本研究では,人間の動作モデルにより,課題条件下でのスムーズで正確な予測が可能であることを示す。我々は,MAVソーシャルナビゲーションのための実際の人的軌跡をシミュレーションで検証する。
参考スコア（独自算出の注目度）: 12.405502383018023
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Robust and accurate perception of humans in their 3D scene context is essential for integrating robots into everyday environments. Existing approaches, however, often fail to predict plausible and accurate human motion estimates that are consistent with the surrounding scene, especially in the presence of heavy occlusions or partial visibility. This can limit both safety and efficiency for robotic operations. We introduce HumanFlow, a latent diffusion model that unifies human motion tracking and forecasting, conditioned on the 3D scene context. We show that our human motion model produces smooth and accurate predictions under challenging conditions, including heavy occlusions, and outperforms state-of-the-art methods in tracking accuracy while being significantly more efficient. Furthermore, we show how HumanFlow's latent space can be tightly coupled with control by conditioning a flow-matching-based, approximate MPC policy on these representations. We validate our policy in simulation with real human trajectories for MAV social navigation, demonstrating superior navigation performance and remaining collision-free, even under partial observability of the human.
Abstract（参考訳）: 3Dシーンにおける人間のロバストで正確な認識は、ロボットを日常の環境に統合するために不可欠である。しかし、既存のアプローチはしばしば、周囲のシーン、特に重い閉塞や部分的な可視性の存在において、可塑性で正確な人間の動きの推定を予測できない。これにより、ロボット操作の安全性と効率を制限できる。本稿では,人間の動きのトラッキングと予測を統合した潜時拡散モデルHumanFlowを紹介する。人間の動作モデルでは,重閉塞を含む難易度条件下でのスムーズで正確な予測が得られ,精度を著しく向上させながら,最先端の手法よりも優れていることを示す。さらに,HumanFlowの潜在空間が,フローマッチングに基づく近似的なMPCポリシをこれらの表現に条件付けすることで,制御と密結合できることを示す。我々は,MAVソーシャルナビゲーションのための実際の人体軌道を用いたシミュレーションにおいて,より優れたナビゲーション性能を示し,人間の部分観測性の下でも衝突のない状態にあることを実証する。

関連論文リスト

EmbodMocap: In-the-Wild 4D Human-Scene Reconstruction for Embodied Agents [85.77432303199176]
EmbodMocapは2つの動くiPhoneを使ったポータブルで安価なデータ収集パイプラインである。私たちのキーとなるアイデアは、二重RGB-Dシーケンスを共同で校正し、人間とシーンの両方を再構築することです。収集したデータに基づいて、我々は3つの具体的AIタスクを強化した: モノクラーヒューマン・シーン・リコンストラクション(モノクラーヒューマン・シーン・リコンストラクション)、メトリックスケールで世界空間に整合した人間とシーンを出力するフィードフォワードモデル、物理ベースのキャラクターアニメーション。
論文参考訳（メタデータ） (2026-02-26T16:53:41Z)
SONIC: Supersizing Motion Tracking for Natural Humanoid Whole-Body Control [85.91101551600978]
モデルキャパシティ,データ,計算のスケールアップにより,自然かつ堅牢な体の動きを生成できる汎用的なヒューマノイドコントローラが得られることを示す。我々は、ネットワークサイズ、データセットボリューム、計算の3つの軸に沿ってスケーリングすることで、モーショントラッキングのための基礎モデルを構築します。本研究では,(1)動作追跡を下流タスク実行にブリッジし,自然かつインタラクティブな制御を可能にするリアルタイムユニバーサルキネマティックプランナ,(2)様々な動作入力インタフェースをサポートする統一トークン空間の2つのメカニズムにより,モデルの実用性を示す。
論文参考訳（メタデータ） (2025-11-11T04:37:40Z)
Aligning Human Motion Generation with Human Perceptions [51.831338643012444]
本研究では,大規模人間の知覚評価データセットであるMotionPerceptと,人間の動作批判モデルであるMotionCriticを導入することにより,ギャップを埋めるデータ駆動型アプローチを提案する。我々の批評家モデルは、運動品質を評価するためのより正確な指標を提供しており、容易に運動生成パイプラインに統合することができる。
論文参考訳（メタデータ） (2024-07-02T14:01:59Z)
CoNav: A Benchmark for Human-Centered Collaborative Navigation [66.6268966718022]
協調ナビゲーション(CoNav)ベンチマークを提案する。われわれのCoNavは、現実的で多様な人間の活動を伴う3Dナビゲーション環境を構築するという重要な課題に取り組む。本研究では,長期的意図と短期的意図の両方を推論する意図認識エージェントを提案する。
論文参考訳（メタデータ） (2024-06-04T15:44:25Z)
Multimodal Sense-Informed Prediction of 3D Human Motions [16.71099574742631]
本研究は,2つのモーダル情報に対して高忠実度を生成するマルチモーダル・インフォームド・モーション・予測手法を提案する。視線情報は人間の意図と見なされ、動きとシーンの特徴が組み合わさって、世代を監督するために第3の意図に注意を向ける。実世界の2つのベンチマークにおいて,提案手法は3次元人間のポーズと軌道予測の両方において最先端の性能を達成する。
論文参考訳（メタデータ） (2024-05-05T12:38:10Z)
EgoNav: Egocentric Scene-aware Human Trajectory Prediction [15.346096596482857]
ウェアラブルなコラボレーティブロボットは、転倒防止支援を必要とする人や、外骨格を装着する人を助ける。このようなロボットは、自我中心の視覚に基づいて周囲のシーンに常に適応し、着用者の自我の動きを予測する必要がある。本研究では、身体に装着したカメラとセンサーを利用して、複雑な環境下での人間の着用者の軌道を予測した。
論文参考訳（メタデータ） (2024-03-27T21:43:12Z)
Robots That Can See: Leveraging Human Pose for Trajectory Prediction [30.919756497223343]
本研究では,人間中心環境における未来の軌道を予測するためのトランスフォーマーアーキテクチャを提案する。結果として得られたモデルは、将来の人間の軌道予測に固有の不確実性を捉えている。我々は,限られた履歴データを持つ新しいエージェントを誤りの主な要因として同定し,予測誤差を低減するために3次元骨格ポーズの相補的な性質を実証する。
論文参考訳（メタデータ） (2023-09-29T13:02:56Z)
Visual Navigation Among Humans with Optimal Control as a Supervisor [72.5188978268463]
そこで本研究では,学習に基づく知覚とモデルに基づく最適制御を組み合わせることで,人間間をナビゲートする手法を提案する。私たちのアプローチは、新しいデータ生成ツールであるHumANavによって実現されています。学習したナビゲーションポリシーは、将来の人間の動きを明示的に予測することなく、人間に予測し、反応できることを実証する。
論文参考訳（メタデータ） (2020-03-20T16:13:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。