Fugu-MT 論文翻訳(概要): Semantic-Metric Bayesian Risk Fields: Learning Robot Safety from Human Videos with a VLM Prior

論文の概要: Semantic-Metric Bayesian Risk Fields: Learning Robot Safety from Human Videos with a VLM Prior

arxiv url: http://arxiv.org/abs/2512.08233v1
Date: Tue, 09 Dec 2025 04:19:58 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:40.221822
Title: Semantic-Metric Bayesian Risk Fields: Learning Robot Safety from Human Videos with a VLM Prior
Title（参考訳）: セマンティック・メトリカルベイズリスクフィールド:VLMによる人間のビデオからロボットの安全性を学習する
Authors: Timothy Chen, Marcus Dominguez-Kuhne, Aiden Swann, Xu Liu, Mac Schwager,
Abstract要約: 人間は安全を二元信号ではなく、連続的、文脈に依存したリスクの概念として解釈する。本研究は、安全な人間のデモビデオとVLM常識から直接監督される暗黙の人間のリスクモデルを抽出する枠組みを提案する。
参考スコア（独自算出の注目度）: 10.193047117743221
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Humans interpret safety not as a binary signal but as a continuous, context- and spatially-dependent notion of risk. While risk is subjective, humans form rational mental models that guide action selection in dynamic environments. This work proposes a framework for extracting implicit human risk models by introducing a novel, semantically-conditioned and spatially-varying parametrization of risk, supervised directly from safe human demonstration videos and VLM common sense. Notably, we define risk through a Bayesian formulation. The prior is furnished by a pretrained vision-language model. In order to encourage the risk estimate to be more human aligned, a likelihood function modulates the prior to produce a relative metric of risk. Specifically, the likelihood is a learned ViT that maps pretrained features, to pixel-aligned risk values. Our pipeline ingests RGB images and a query object string, producing pixel-dense risk images. These images that can then be used as value-predictors in robot planning tasks or be projected into 3D for use in conventional trajectory optimization to produce human-like motion. This learned mapping enables generalization to novel objects and contexts, and has the potential to scale to much larger training datasets. In particular, the Bayesian framework that is introduced enables fast adaptation of our model to additional observations or common sense rules. We demonstrate that our proposed framework produces contextual risk that aligns with human preferences. Additionally, we illustrate several downstream applications of the model; as a value learner for visuomotor planners or in conjunction with a classical trajectory optimization algorithm. Our results suggest that our framework is a significant step toward enabling autonomous systems to internalize human-like risk. Code and results can be found at https://riskbayesian.github.io/bayesian_risk/.
Abstract（参考訳）: 人間は安全を二元信号ではなく、連続的、文脈に依存したリスクの概念として解釈する。リスクは主観的であるが、人間は動的環境における行動選択を導く合理的な精神モデルを形成する。本研究は,安全人体デモビデオとVLM共通感覚から直接監督される,新しい,意味的条件付き,空間的に変化するリスクのパラメトリゼーションを導入することで,暗黙の人間のリスクモデルを抽出する枠組みを提案する。特に、ベイズ的定式化によるリスクを定義する。前者は事前訓練された視覚言語モデルによって構成される。リスク推定がより人間と一致するように促すため、確率関数はリスクの相対的な指標を生成するために事前を変調する。特に、学習されたViTは、事前訓練された特徴をピクセルの一致したリスク値にマッピングする。我々のパイプラインはRGB画像とクエリオブジェクト文字列を取り込み、画素密度のリスク画像を生成する。これらの画像は、ロボットの計画作業に価値予測器として使用したり、従来の軌道最適化に使用するために3Dに投影されたりすることができる。この学習されたマッピングは、新しいオブジェクトやコンテキストへの一般化を可能にし、より大きなトレーニングデータセットにスケールする可能性がある。特に、導入されたベイズフレームワークは、我々のモデルを追加の観測や常識規則に迅速に適応させることができる。提案手法は,人間の嗜好に合致する文脈的リスクを生じさせることを示す。さらに、ビズモータプランナの値学習や、古典的な軌道最適化アルゴリズムとの併用など、モデルのダウンストリーム応用について述べる。我々のフレームワークは、自律的なシステムが人間のようなリスクを内部化するための重要なステップであることを示している。コードと結果はhttps://riskbayesian.github.io/bayesian_risk/で確認できる。

関連論文リスト

SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文参考訳（メタデータ） (2025-10-20T19:53:02Z)
Context-Aware Risk Estimation in Home Environments: A Probabilistic Framework for Service Robots [2.5695499302569327]
本稿では,サービスロボットにおけるリアルタイムのリスク認識向上を目的とした,日常の屋内シーンにおける事故発生地域を推定するための新しい枠組みを提案する。提案手法は,セマンティックグラフに基づく伝搬アルゴリズムを用いて,オブジェクトレベルのリスクとコンテキストをモデル化する。提案手法は,人間に注釈を付けたリスク領域を持つデータセット上で検証され,リスク検出精度は75%である。
論文参考訳（メタデータ） (2025-08-27T11:14:05Z)
Risk-aware Direct Preference Optimization under Nested Risk Measure [23.336246526648374]
Ra-DPO(Ra-Aware Direct Preference Optimization)は、ネストしたリスク対策を取り入れた新しいアプローチである。 3つのオープンソースデータセットに対する実験結果は、アライメント性能とモデルドリフトのバランスをとる上で、提案手法の優れた性能を示す。
論文参考訳（メタデータ） (2025-05-26T08:01:37Z)
Breaking Free: How to Hack Safety Guardrails in Black-Box Diffusion Models! [52.0855711767075]
EvoSeedは、フォトリアリスティックな自然対向サンプルを生成するための進化戦略に基づくアルゴリズムフレームワークである。我々は,CMA-ESを用いて初期種ベクトルの探索を最適化し,条件付き拡散モデルで処理すると,自然逆数サンプルをモデルで誤分類する。実験の結果, 生成した対向画像は画像品質が高く, 安全分類器を通過させることで有害なコンテンツを生成する懸念が高まっていることがわかった。
論文参考訳（メタデータ） (2024-02-07T09:39:29Z)
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning [12.156082576280955]
危険環境への展開には、ロボットが事故を防ぐための行動や動きに関連するリスクを理解する必要がある。本稿では,分散強化学習を用いたリスクセンシティブな移動訓練手法を提案する。シミュレーションおよび四足歩行ロボットANYmalにおいて,突発的リスクに敏感な移動行動を示す。
論文参考訳（メタデータ） (2023-09-25T16:05:32Z)
Adaptive Risk Tendency: Nano Drone Navigation in Cluttered Environments with Distributional Reinforcement Learning [17.940958199767234]
適応型リスク傾向ポリシーを学習するための分散強化学習フレームワークを提案する。本アルゴリズムは,シミュレーションと実世界の実験の両方において,ハエのリスク感度を調整可能であることを示す。
論文参考訳（メタデータ） (2022-03-28T13:39:58Z)
Attribute-Guided Adversarial Training for Robustness to Natural Perturbations [64.35805267250682]
本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文参考訳（メタデータ） (2020-12-03T10:17:30Z)
Risk-Sensitive Sequential Action Control with Multi-Modal Human Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文参考訳（メタデータ） (2020-09-12T02:02:52Z)
Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文参考訳（メタデータ） (2020-07-28T07:34:30Z)
Guided Uncertainty-Aware Policy Optimization: Combining Learning and Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文参考訳（メタデータ） (2020-05-21T19:47:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。