論文の概要: Theoretical Closed-loop Stability Bounds for Dynamical System Coupled with Diffusion Policies
- arxiv url: http://arxiv.org/abs/2511.15520v1
- Date: Wed, 19 Nov 2025 15:13:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.864397
- Title: Theoretical Closed-loop Stability Bounds for Dynamical System Coupled with Diffusion Policies
- Title(参考訳): 拡散ポリシを結合した力学系の理論的閉ループ安定性境界
- Authors: Gabriel Lauzier, Alexandre Girard, François Ferland,
- Abstract要約: 本研究は、作用を実行する前に部分的にしか除音処理を行わない可能性について研究し、コンピュータ上で進行する逆時間拡散ダイナミクスと平行して植物が動的に進化することを可能にする。
この研究の貢献により、高速な模倣学習のためのフレームワークと、デモのばらつきに基づいてコントローラが安定しているかどうかを判断するメトリクスが提供される。
- 参考スコア(独自算出の注目度): 39.499082381148035
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Diffusion Policy has shown great performance in robotic manipulation tasks under stochastic perturbations, due to its ability to model multimodal action distributions. Nonetheless, its reliance on a computationally expensive reverse-time diffusion (denoising) process, for action inference, makes it challenging to use for real-time applications where quick decision-making is mandatory. This work studies the possibility of conducting the denoising process only partially before executing an action, allowing the plant to evolve according to its dynamics in parallel to the reverse-time diffusion dynamics ongoing on the computer. In a classical diffusion policy setting, the plant dynamics are usually slow and the two dynamical processes are uncoupled. Here, we investigate theoretical bounds on the stability of closed-loop systems using diffusion policies when the plant dynamics and the denoising dynamics are coupled. The contribution of this work gives a framework for faster imitation learning and a metric that yields if a controller will be stable based on the variance of the demonstrations.
- Abstract(参考訳): 拡散政策は、マルチモーダルな行動分布をモデル化できるため、確率的摂動下でのロボット操作タスクにおいて優れた性能を示した。
それでも、計算的に高価な逆時間拡散(デノジング)プロセスに依存しているため、迅速な意思決定が必須であるリアルタイムアプリケーションでは使用が難しい。
本研究は、作用を実行する前に部分的にしか除音処理を行わない可能性について研究し、コンピュータ上で進行する逆時間拡散ダイナミクスと平行して植物が動的に進化することを可能にする。
古典的な拡散政策では、植物力学は通常遅く、2つの動的過程は非結合である。
そこで本研究では,植物力学とデノナイジング力学を結合させた場合の拡散ポリシを用いた閉ループ系の安定性に関する理論的境界について検討する。
この研究の貢献により、高速な模倣学習のためのフレームワークと、デモのばらつきに基づいてコントローラが安定しているかどうかを判断するメトリクスが提供される。
関連論文リスト
- Towards Fast Coarse-graining and Equation Discovery with Foundation Inference Models [6.403678133359229]
高次元記録における潜伏力学は、しばしばより小さな有効変数の集合によって特徴づけられる。
ほとんどの機械学習アプローチは、動的一貫性を強制するモデルとともにオートエンコーダをトレーニングすることで、これらのタスクに共同で取り組む。
我々は最近導入されたファンデーション推論モデル(FIM)を利用して2つの問題を分離することを提案する。
半円拡散を合成ビデオデータに埋め込んだ二重井戸系における概念実証は、高速で再利用可能な粗粒化パイプラインに対するこのアプローチの可能性を示している。
論文 参考訳(メタデータ) (2025-10-14T15:17:23Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Forecasting Continuous Non-Conservative Dynamical Systems in SO(3) [51.510040541600176]
コンピュータビジョンにおける移動物体の回転をモデル化するための新しい手法を提案する。
我々のアプローチは、入力ノイズに対して頑健でありながら、エネルギーと運動量保存に非依存である。
トレーニング中の雑音状態から物体のダイナミクスを近似させることで、シミュレーションや様々な現実世界の設定において頑健な外挿能力が得られる。
論文 参考訳(メタデータ) (2025-08-11T09:03:10Z) - Robustly optimal dynamics for active matter reservoir computing [0.0]
貯水池計算のパラダイムにおいて, 活性物質の情報処理能力について検討し, カオス信号の将来状態を推定する。
我々はこれまで見過ごされてきたエージェント・ダイナミクスの並外れた体制を明らかにする。
多くの条件下での性能に対して堅牢に最適化されており、より一般的に物理システムによる計算に関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2025-05-08T17:09:14Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Streaming Diffusion Policy: Fast Policy Synthesis with Variable Noise Diffusion Models [24.34842113104745]
拡散モデルはロボット模倣学習に急速に採用され、複雑なタスクを自律的に実行できるようになった。
近年の研究では、拡散過程の蒸留が政策合成の加速にどのように役立つかが研究されている。
本稿では,SDP(Streaming Diffusion Policy)を提案する。
論文 参考訳(メタデータ) (2024-06-07T10:13:44Z) - Value Iteration in Continuous Actions, States and Time [99.00362538261972]
連続状態と動作に対する連続的適合値反復(cFVI)アルゴリズムを提案する。
非線形制御アフィンダイナミクスに対して最適なポリシを導出することができる。
物理システムのビデオは、urlhttps://sites.google.com/view/value-iteration.comで入手できる。
論文 参考訳(メタデータ) (2021-05-10T21:40:56Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。