論文の概要: Ada-Diffuser: Latent-Aware Adaptive Diffusion for Decision-Making
- arxiv url: http://arxiv.org/abs/2605.16054v1
- Date: Fri, 15 May 2026 15:21:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.335575
- Title: Ada-Diffuser: Latent-Aware Adaptive Diffusion for Decision-Making
- Title(参考訳): Ada-Diffuser: 意思決定のための潜時適応拡散
- Authors: Fan Feng, Selena Ge, Minghao Fu, Zijian Li, Yujia Zheng, Zeyu Tang, Yingyao Hu, Biwei Huang, Kun Zhang,
- Abstract要約: 本稿では、潜在動的推論を生成的意思決定に明示的に組み込む統一的なフレームワークを提案する。
Ada-Diffuserは計画と政策学習の両方をサポートし、動的、報酬、潜伏行動の潜伏変化への適応を可能にする。
- 参考スコア(独自算出の注目度): 35.06448836239817
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent work has framed decision-making as a sequence modeling problem using generative models such as diffusion models. Although promising, these approaches often overlook latent factors that exhibit evolving dynamics, elements that are fundamental to environment transitions, reward structures, and high-level agent behavior. Explicitly modeling these hidden processes is essential for both precise dynamics modeling and effective decision-making. In this paper, we propose a unified framework that explicitly incorporates latent dynamic inference into generative decision-making from minimal yet sufficient observations. We theoretically show that under mild conditions, the latent process can be identified from small temporal blocks of observations. Building on this insight, we introduce Ada-Diffuser, a causal diffusion model that learns the temporal structure of observed interactions and the underlying latent dynamics simultaneously, and furthermore, leverages them for planning and control. With a modular design, Ada-Diffuser supports both planning and policy learning tasks, enabling adaptation to latent variations in dynamics, rewards, and latent actions. Experiments on simulated control and robotic benchmarks demonstrate its effectiveness in accurate latent inference and adaptive policy learning.
- Abstract(参考訳): 最近の研究は、拡散モデルのような生成モデルを用いたシーケンスモデリング問題として、意思決定の枠組みを定めている。
有望ではあるが、これらのアプローチは、進化する動的要素、環境遷移、報酬構造、高レベルのエージェントの振る舞いの基本となる要素をしばしば見落としている。
これらの隠されたプロセスを明示的にモデル化することは、正確なダイナミクスモデリングと効果的な意思決定の両方に不可欠である。
本稿では,最小かつ十分な観測結果から,潜在動的推論を生成的意思決定に明示的に組み込む統一的な枠組みを提案する。
理論的には、温和な条件下では、潜伏過程は観測の小さな時間ブロックから特定できる。
この知見に基づいて、観測された相互作用と下層の潜伏力学の時間構造を同時に学習する因果拡散モデルであるAda-Diffuserを導入し、さらにそれらを計画と制御に活用する。
モジュール設計により、Ada-Diffuserは計画とポリシー学習の両方のタスクをサポートし、動的、報酬、潜伏アクションの潜伏変化への適応を可能にする。
シミュレーション制御とロボットベンチマークの実験では、正確な潜伏推論と適応ポリシー学習の有効性が示されている。
関連論文リスト
- State-Action Inpainting Diffuser for Continuous Control with Delay [28.10905055038984]
State-Action Inpainting Diffuser (SAID)は、動的学習の帰納バイアスと政策最適化の直接的な意思決定能力を統合するフレームワークである。
本研究は,遅延を伴う継続的制御と強化学習の分野を前進させる新しい手法を提案する。
論文 参考訳(メタデータ) (2026-03-02T07:28:27Z) - Reasoning Palette: Modulating Reasoning via Latent Contextualization for Controllable Exploration for (V)LMs [49.66344956133349]
推論能力は、大規模な(ビジョン)言語モデルのための推論時間性能と強化学習(RL)トレーニングの両方を形作る。
本稿では,戦略的文脈化のための潜在変数をモデルに付与する新しい潜在変調フレームワークであるReasoning Paletteを提案する。
論文 参考訳(メタデータ) (2025-12-19T03:32:53Z) - Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。
i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T06:26:02Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Sequential Representation Learning via Static-Dynamic Conditional Disentanglement [58.19137637859017]
本稿では,ビデオ中の時間非依存要因と時間変化要因を分離することに着目し,逐次的データ内での自己教師付き不整合表現学習について検討する。
本稿では,静的/動的変数間の因果関係を明示的に考慮し,それらの因子間の通常の独立性仮定を破る新しいモデルを提案する。
実験により、提案手法は、シーンのダイナミックスが内容に影響されるシナリオにおいて、従来の複雑な最先端技術よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-08-10T17:04:39Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Neural Superstatistics for Bayesian Estimation of Dynamic Cognitive
Models [2.7391842773173334]
我々は,時間変化パラメータと時間不変パラメータの両方を復元できるベイズ推論のシミュレーションに基づくディープラーニング手法を開発した。
この結果から,ディープラーニングアプローチは時間的ダイナミクスを捉える上で極めて効率的であることが示唆された。
論文 参考訳(メタデータ) (2022-11-23T17:42:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。