Fugu-MT 論文翻訳(概要): SafeFlow: Real-Time Text-Driven Humanoid Whole-Body Control via Physics-Guided Rectified Flow and Selective Safety Gating

論文の概要: SafeFlow: Real-Time Text-Driven Humanoid Whole-Body Control via Physics-Guided Rectified Flow and Selective Safety Gating

arxiv url: http://arxiv.org/abs/2603.23983v1
Date: Wed, 25 Mar 2026 06:24:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-26 21:06:11.160401
Title: SafeFlow: Real-Time Text-Driven Humanoid Whole-Body Control via Physics-Guided Rectified Flow and Selective Safety Gating
Title（参考訳）: SafeFlow:物理誘導整流と選択安全ゲーティングによるリアルタイムテキスト駆動型ヒューマノイド全体制御
Authors: Hanbyel Cho, Sang-Hun Kim, Jeonguk Kang, Donghan Koo,
Abstract要約: SafeFlowはテキスト駆動のヒューマノイド全体のコントロールフレームワークである。物理誘導型モーションジェネレーションと、明示的なリスク指標によって駆動される3段安全ゲートを組み合わせる。従来の拡散に基づく手法よりも、成功率、物理的コンプライアンス、推論速度が優れている。
参考スコア（独自算出の注目度）: 5.252722148826105
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Recent advances in real-time interactive text-driven motion generation have enabled humanoids to perform diverse behaviors. However, kinematics-only generators often exhibit physical hallucinations, producing motion trajectories that are physically infeasible to track with a downstream motion tracking controller or unsafe for real-world deployment. These failures often arise from the lack of explicit physics-aware objectives for real-robot execution and become more severe under out-of-distribution (OOD) user inputs. Hence, we propose SafeFlow, a text-driven humanoid whole-body control framework that combines physics-guided motion generation with a 3-Stage Safety Gate driven by explicit risk indicators. SafeFlow adopts a two-level architecture. At the high level, we generate motion trajectories using Physics-Guided Rectified Flow Matching in a VAE latent space to improve real-robot executability, and further accelerate sampling via Reflow to reduce the number of function evaluations (NFE) for real-time control. The 3-Stage Safety Gate enables selective execution by detecting semantic OOD prompts using a Mahalanobis score in text-embedding space, filtering unstable generations via a directional sensitivity discrepancy metric, and enforcing final hard kinematic constraints such as joint and velocity limits before passing the generated trajectory to a low-level motion tracking controller. Extensive experiments on the Unitree G1 demonstrate that SafeFlow outperforms prior diffusion-based methods in success rate, physical compliance, and inference speed, while maintaining diverse expressiveness.
Abstract（参考訳）: 近年のインタラクティブなテキスト駆動モーション生成の進歩により、ヒューマノイドは多様な行動を実行できるようになった。しかし、キネマティクスのみのジェネレータは物理的幻覚を呈し、下流のモーショントラッキングコントローラで追跡できないモーショントラジェクトリを生成する。これらの失敗は、実ロボット実行のための明示的な物理認識の目的が欠如していることから生じることが多く、アウト・オブ・ディストリビューション(OOD)ユーザ入力下ではより深刻になる。そこで我々は,物理誘導運動生成と明示的なリスク指標によって駆動される3段階安全ゲートを組み合わせたテキスト駆動型ヒューマノイド全体制御フレームワークSafeFlowを提案する。 SafeFlowは2レベルアーキテクチャを採用している。高レベルでは、VAE潜在空間における物理誘導整流流マッチングを用いて運動軌跡を生成し、実ロボット実行性を改善し、さらにReflowによるサンプリングを加速し、リアルタイム制御のための関数評価(NFE)の回数を減らす。 3段階安全ゲートは、テキスト埋め込み空間におけるマハラノビススコアを用いてセマンティックOODプロンプトを検出し、指向性差分距離によって不安定な世代をフィルタリングし、生成した軌道を低レベルモーショントラッキングコントローラに渡す前に、関節および速度制限などの最終硬度運動制約を強制することにより、選択的実行を可能にする。 Unitree G1の大規模な実験では、SafeFlowは、様々な表現性を維持しながら、成功率、物理的コンプライアンス、推論速度において、事前の拡散に基づく手法よりも優れていることが示されている。

関連論文リスト

FASTER: Rethinking Real-Time Flow VLAs [82.58822112377923]
VLA(Vision-Language-Action)モデルを物理世界に展開するには、リアルタイム実行が不可欠である。反応時間は、TTFA(Time to First Action)と実行地平線によって決定される一様分布に従っていることを示す。即時反応のための高速動作サンプリング(FASTER)を提案し,この問題を克服する。
論文参考訳（メタデータ） (2026-03-19T17:51:37Z)
RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids [20.796118584632904]
自然言語と全身移動を橋渡しする統合潜在駆動型フレームワークを提案する。我々のフレームワークは、テキスト誘導型ヒューマノイドインテリジェンスをデプロイするための実践的なパスを提供する。
論文参考訳（メタデータ） (2026-03-18T17:02:56Z)
ProbeFlow: Training-Free Adaptive Flow Matching for Vision-Language-Action Models [12.232846303286161]
近年,フローマッチング (FM) アクションヘッドを搭載したビジョン・ランゲージ・アクション (VLA) モデルは,複雑なロボット操作において最先端の性能を実現する。現在の加速はビジョン・ランゲージ・モデル(VLM)のバックボーンを最適化しているが、アクションヘッドのボトルネックは見落としている。本稿では,継続的ロボット制御のためのトレーニング不要適応推論フレームワークProbeFlowを提案する。
論文参考訳（メタデータ） (2026-03-18T15:38:29Z)
Ada3Drift: Adaptive Training-Time Drifting for One-Step 3D Visuomotor Robotic Manipulation [53.750389076941396]
拡散に基づくビジュモータポリシーは反復的認知を通じて多モーダルな動作分布をキャプチャするが、その高い推論遅延はリアルタイムロボット制御を制限する。 Ada3Driftは,専門家のデモモードに対して予測された行動を引き付ける訓練時間ドリフト場を学習する。 Ada3Driftは、拡散ベースの代替よりも10倍の関数評価を必要としながら、最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2026-03-12T14:36:53Z)
Constraining Streaming Flow Models for Adapting Learned Robot Trajectory Distributions [10.615762867055677]
Streaming Flow Policies (SFPs) は,学習速度場をアクション空間に直接統合することにより,ロボット軌道を生成するための強力なパラダイムとして登場した。本研究では,ストリーミングフローポリシーを制約に依存したメトリクスで拡張し,実行中に学習速度場を再構築するフレームワークであるConstraint-Aware Streaming Flow (CASF)を提案する。シミュレーションおよび実世界の操作タスクにおいてCASFを実証し、スムーズで実現可能で、動的に一貫した制約を満たす軌道を生成することを示した。
論文参考訳（メタデータ） (2026-02-17T13:27:05Z)
TextOp: Real-time Interactive Text-Driven Humanoid Robot Motion Generation and Control [62.93681680333618]
TextOpはリアルタイムテキスト駆動型ヒューマノイドモーション生成および制御フレームワークである。ストリーミング言語コマンドと実行中のオンザフライ命令修正をサポートする。対話型モーション生成を堅牢な全身制御でブリッジすることで、TextOpは自由形式のインテント表現をアンロックする。
論文参考訳（メタデータ） (2026-02-07T08:42:11Z)
FlowDrive: Energy Flow Field for End-to-End Autonomous Driving [50.89871153094958]
FlowDriveは、物理的に解釈可能なエネルギーベースのフローフィールドを導入し、セマンティックな前提と安全性をBEV空間にエンコードする新しいフレームワークである。 NAVSIM v2ベンチマークの実験では、FlowDriveが最先端のパフォーマンスを86.3で達成し、安全性と計画品質の両方において以前のベースラインを超えたことが示されている。
論文参考訳（メタデータ） (2025-09-17T13:51:33Z)
SuperFlow++: Enhanced Spatiotemporal Consistency for Cross-Modal Data Pretraining [62.433137130087445]
SuperFlow++は、連続するカメラペアを使用して事前トレーニングと下流タスクを統合する新しいフレームワークである。 SuperFlow++は様々なタスクや運転条件で最先端のメソッドよりも優れています。強力な一般化性と計算効率により、SuperFlow++は、自動運転におけるデータ効率の高いLiDARベースの認識のための新しいベンチマークを確立する。
論文参考訳（メタデータ） (2025-03-25T17:59:57Z)
TLControl: Trajectory and Language Control for Human Motion Synthesis [68.09806223962323]
本稿では,人間のリアルな動き合成のための新しい手法であるTLControlを提案する。低レベルのTrajectoryと高レベルのLanguage semanticsコントロールが組み込まれている。インタラクティブで高品質なアニメーション生成には実用的である。
論文参考訳（メタデータ） (2023-11-28T18:54:16Z)
Unified Control Framework for Real-Time Interception and Obstacle Avoidance of Fast-Moving Objects with Diffusion Variational Autoencoder [2.5642257132861923]
動的環境におけるロボットアームによる高速移動物体のリアルタイムインターセプションは、非常に困難な課題である。本稿では,動的オブジェクトを同時にインターセプトし,移動障害を回避することで,課題に対処する統一的な制御フレームワークを提案する。
論文参考訳（メタデータ） (2022-09-27T18:46:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。