Fugu-MT 論文翻訳(概要): Hybrid-Diffusion Models: Combining Open-loop Routines with Visuomotor Diffusion Policies

論文の概要: Hybrid-Diffusion Models: Combining Open-loop Routines with Visuomotor Diffusion Policies

arxiv url: http://arxiv.org/abs/2512.04960v1
Date: Thu, 04 Dec 2025 16:29:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:40.132669
Title: Hybrid-Diffusion Models: Combining Open-loop Routines with Visuomotor Diffusion Policies
Title（参考訳）: ハイブリッド拡散モデル:開ループルーチンとビジュモータ拡散法を組み合わせる
Authors: Jonne Van Haastregt, Bastian Orthmann, Michael C. Welle, Yuchong Zhang, Danica Kragic,
Abstract要約: オープンループルーチンとビジュモータ拡散ポリシを組み合わせたハイブリッド拡散モデルを提案する。我々は,オペレータが事前に定義されたルーチンを実行できるように,TAP(Teleoperation Augmentation Primitives)を開発した。実世界の課題であるバイアル・アスピレーション, オープン・コンテナ・リキッドトランスファー, コンテナ・アンサーイングの手法を検証する。
参考スコア（独自算出の注目度）: 13.044881557547647
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Despite the fact that visuomotor-based policies obtained via imitation learning demonstrate good performances in complex manipulation tasks, they usually struggle to achieve the same accuracy and speed as traditional control based methods. In this work, we introduce Hybrid-Diffusion models that combine open-loop routines with visuomotor diffusion policies. We develop Teleoperation Augmentation Primitives (TAPs) that allow the operator to perform predefined routines, such as locking specific axes, moving to perching waypoints, or triggering task-specific routines seamlessly during demonstrations. Our Hybrid-Diffusion method learns to trigger such TAPs during inference. We validate the method on challenging real-world tasks: Vial Aspiration, Open-Container Liquid Transfer, and container unscrewing. All experimental videos are available on the project's website: https://hybriddiffusion.github.io/
Abstract（参考訳）: 模倣学習によって得られるビジュモータベースのポリシーは複雑な操作タスクにおいて優れた性能を示すが、通常は従来の制御ベースの手法と同じ精度と速度を達成するのに苦労する。本研究では,オープンループルーチンとビジュモータ拡散ポリシを組み合わせたハイブリッド拡散モデルを提案する。我々は,TAP(Teleoperation Augmentation Primitives)を開発し,特定の軸をロックしたり,ウェイポイントに移動したり,デモ中にタスク固有のルーチンをシームレスにトリガーしたりするといった,事前に定義されたルーチンを実行可能にする。我々のハイブリッド拡散法は、推論中にそのようなTAPをトリガーすることを学ぶ。実世界の課題であるバイアル・アスピレーション, オープン・コンテナ・リキッドトランスファー, コンテナ・アンサーイングの手法を検証する。すべての実験ビデオはプロジェクトのWebサイトで公開されている。

関連論文リスト

Sample from What You See: Visuomotor Policy Learning via Diffusion Bridge with Observation-Embedded Stochastic Differential Equation [28.95872004551021]
拡散モデルによる模倣学習は、多モーダルな動作分布を捉えることにより、ロボット制御が進歩する。既存のアプローチでは、拡散過程自体のダイナミックスにそれらを組み込むのではなく、デノナイジングネットワークへの高レベルな条件付け入力として観測を扱います。本稿では,拡散ブリッジの定式化を通じて微分方程式内に観測を埋め込む生成的ビズモータポリシであるブリッジポリシーを紹介する。
論文参考訳（メタデータ） (2025-12-08T06:47:32Z)
Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling Approach [78.4812458793128]
動作チャンクの高忠実度検証に軽量な擬数推定器を適用したテスト時間スケーリングフレームワークである textbfTACO を提案する。我々の手法は、オフライン強化学習(RL)における古典的な反探索原理に似ており、勾配のないため、計算上の大きな恩恵をもたらす。
論文参考訳（メタデータ） (2025-12-02T14:42:54Z)
MoTE: Mixture of Task-specific Experts for Pre-Trained ModelBased Class-incremental Learning [39.892628170627496]
クラスインクリメンタルラーニング(CIL)では、ストリーミングデータから新たな知識を継続的に取得するために、ディープラーニングモデルが必要である。プロンプトベースのアプローチはプロンプトオーバーライトに悩まされ、アダプタベースの手法はタスク間の次元的ミスアライメントのような課題に直面している。本稿では,不整合出力次元による誤判定を効果的に軽減するタスク特化専門家(MoTE)フレームワークの混合を提案する。
論文参考訳（メタデータ） (2025-05-21T03:06:10Z)
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model [54.64088247291416]
操作ポリシー設計の基本的な目的は、ロボットに人間の指示を理解し、シーンの手がかりを推論し、動的な環境で一般化されたアクションを実行することである。近年の自己回帰的視覚言語行動(VLA)法は、視覚言語モデル(VLM)から常識推論能力を継承し、次の行動予測を行う。拡散に基づく行動の連続的な性質と自己回帰の文脈的推論を吸収する統合フレームワークであるHybridVLAを紹介する。
論文参考訳（メタデータ） (2025-03-13T17:59:52Z)
Unsupervised Discovery of Interpretable Directions in h-space of Pre-trained Diffusion Models [63.1637853118899]
本稿では,事前学習した拡散モデルのh空間における解釈可能な方向を特定するための,教師なしおよび学習に基づく最初の手法を提案する。我々は、事前訓練された拡散モデルのh-スペースで動作するシフト制御モジュールを用いて、サンプルをシフトしたバージョンに操作する。それらを共同で最適化することで、モデルは自然に絡み合った、解釈可能な方向を発見する。
論文参考訳（メタデータ） (2023-10-15T18:44:30Z)
Crossway Diffusion: Improving Diffusion-based Visuomotor Policy via Self-supervised Learning [42.009856923352864]
拡散モデルは、シーケンス・モデリング方式で行動的クローニングに採用されている。拡散に基づくビジュモータポリシー学習の簡易かつ効果的な手法であるクロスウェイ拡散を提案する。シミュレーションおよび実世界のロボット作業におけるクロスウェイ拡散の有効性を実証した。
論文参考訳（メタデータ） (2023-07-04T17:59:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。