論文の概要: Encoding Predictability and Legibility for Style-Conditioned Diffusion Policy
- arxiv url: http://arxiv.org/abs/2603.16368v1
- Date: Tue, 17 Mar 2026 10:55:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.231538
- Title: Encoding Predictability and Legibility for Style-Conditioned Diffusion Policy
- Title(参考訳): スタイル定義拡散政策における予測可能性と可否の符号化
- Authors: Adrien Jacquet Crétides, Mouad Abrini, Hamed Rahimi, Mohamed Chetouani,
- Abstract要約: 効率性と透明な動きのバランスを取ることは、人間とロボットのコラボレーションにおける中核的な課題である。
本稿では,事前学習した拡散モデルに対して,妥当性と効率を両立させるモジュラーフレームワークであるStyle-Conditioned Diffusion Policy (SCDP)を提案する。
操作作業やナビゲーション作業におけるSCDPの評価を行い,不明瞭な環境下での可視性を向上するとともに,可視性が不要な場合の最適効率を保っていることを示す。
- 参考スコア(独自算出の注目度): 1.1549572298362782
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Striking a balance between efficiency and transparent motion is a core challenge in human-robot collaboration, as highly expressive movements often incur unnecessary time and energy costs. In collaborative environments, legibility allows a human observer a better understanding of the robot's actions, increasing safety and trust. However, these behaviors result in sub-optimal and exaggerated trajectories that are redundant in low-ambiguity scenarios where the robot's goal is already obvious. To address this trade-off, we propose Style-Conditioned Diffusion Policy (SCDP), a modular framework that constrains the trajectory generation of a pre-trained diffusion model toward either legibility or efficiency based on the environment's configuration. Our method utilizes a post-training pipeline that freezes the base policy and trains a lightweight scene encoder and conditioning predictor to modulate the diffusion process. At inference time, an ambiguity detection module activates the appropriate conditioning, prioritizing expressive motion only for ambiguous goals and reverting to efficient paths otherwise. We evaluate SCDP on manipulation and navigation tasks, and results show that it enhances legibility in ambiguous settings while preserving optimal efficiency when legibility is unnecessary, all without retraining the base policy.
- Abstract(参考訳): 効率性と透明な動きのバランスを取ることは、人間とロボットのコラボレーションにおける中核的な課題である。
協調的な環境では、人間の観察者がロボットの動作をよりよく理解し、安全性と信頼を高めることができる。
しかし、これらの行動は、ロボットの目標がすでに明確である低曖昧なシナリオでは冗長な、準最適かつ誇張された軌跡をもたらす。
このトレードオフに対処するため,我々は,事前学習した拡散モデルの軌道生成を,環境構成に基づく妥当性と効率の両方に制約するモジュラーフレームワークであるStyle-Conditioned Diffusion Policy (SCDP)を提案する。
提案手法は,基本方針を凍結し,軽量なシーンエンコーダと条件付き予測器を訓練し,拡散過程を変調するポストトレーニングパイプラインを利用する。
推測時、曖昧度検出モジュールは、適切な条件付けを活性化し、曖昧な目標のみに表現運動を優先し、それ以外の場合は効率的な経路に戻す。
操作作業やナビゲーション作業におけるSCDPを評価し,その結果,不明瞭な環境下でのレジリエビリティを向上させるとともに,レジリエビリティが不要な場合の最適効率を保ちながら,基本方針の再訓練を行なわないことを示す。
関連論文リスト
- Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy [52.106797722292896]
我々は,チャンクベースのアクション生成とリアルタイム修正を統合した動的クローズドループ拡散ポリシーフレームワークDCDPを提案する。
動的PushTシミュレーションでは、DCDPは5%の計算しか必要とせず、再トレーニングなしに適応性を19%改善する。
論文 参考訳(メタデータ) (2026-03-02T15:04:18Z) - Efficient Virtuoso: A Latent Diffusion Transformer Model for Goal-Conditioned Trajectory Planning [0.0]
本稿では,目標条件付き軌道計画のための条件付き潜在拡散モデルであるEfficient Virtuosoを提案する。
提案手法は,Open Motionデータセット上での最先端性能を実現し,平均変位誤差(minADE)が0.25であることを示す。
一つのゴールが戦略的曖昧さを解決できる一方で、人間の運転行動を反映した正確で忠実な戦術実行を実現するためには、よりリッチで多段階のスパース経路が不可欠である。
論文 参考訳(メタデータ) (2025-09-03T19:18:02Z) - On-Device Diffusion Transformer Policy for Efficient Robot Manipulation [26.559546714450324]
Diffusion Policiesには、模倣学習によるロボット操作タスクが大幅に進歩している。
リソース制約のあるモバイルプラットフォームへの彼らの適用は、計算の非効率性と広範なメモリフットプリントのため、依然として困難である。
我々は,モバイルデバイス上でリアルタイムにデプロイするためのDiffusion Policiesを高速化する新しいフレームワークであるLightDPを提案する。
論文 参考訳(メタデータ) (2025-08-01T15:14:39Z) - Human-assisted Robotic Policy Refinement via Action Preference Optimization [26.144183856600687]
行動選好最適化(Action Preference Optimization、APO)は、視覚・言語・行動モデル(VLA)を人間の操作による選好アライメントによって洗練する手法である。
これを解決するために、APOは相互作用から導出される二元的望ましくない信号を用いた適応的再重み付けアルゴリズムを提案する。
シミュレーションと実世界のシナリオで行われた実験は、より優れた一般化とロバスト性を示す。
論文 参考訳(メタデータ) (2025-06-08T13:14:18Z) - Latent Adaptive Planner for Dynamic Manipulation [43.959104380268066]
Latent Adaptive Planner (LAP) は、動的非包括的操作のための軌道レベルの遅延変数ポリシーである。
LAPは低次元の潜在空間における推論として計画を定式化し、人間のデモビデオから効果的に学習する。
論文 参考訳(メタデータ) (2025-05-06T00:09:09Z) - Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [73.75271615101754]
本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文 参考訳(メタデータ) (2025-03-25T15:19:56Z) - Diffusion Transformer Policy [48.50988753948537]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。
トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文 参考訳(メタデータ) (2024-10-21T12:43:54Z) - Learning Robust Policy against Disturbance in Transition Dynamics via
State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。
本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。
いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文 参考訳(メタデータ) (2021-12-20T13:13:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。