論文の概要: Instructed Diffuser with Temporal Condition Guidance for Offline
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2306.04875v1
- Date: Thu, 8 Jun 2023 02:12:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 16:55:13.440705
- Title: Instructed Diffuser with Temporal Condition Guidance for Offline
Reinforcement Learning
- Title(参考訳): オフライン強化学習のための時間条件指導付きディフューザ
- Authors: Jifeng Hu, Yanchao Sun, Sili Huang, SiYuan Guo, Hechang Chen, Li Shen,
Lichao Sun, Yi Chang, Dacheng Tao
- Abstract要約: テンポラリ・コンポラブル・ディフューザ(TCD)を用いた実効時間条件拡散モデルを提案する。
TCDは、相互作用シーケンスから時間情報を抽出し、時間条件で生成を明示的にガイドする。
提案手法は,従来のSOTAベースラインと比較して最高の性能を達成または一致させる。
- 参考スコア(独自算出の注目度): 71.24316734338501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent works have shown the potential of diffusion models in computer vision
and natural language processing. Apart from the classical supervised learning
fields, diffusion models have also shown strong competitiveness in
reinforcement learning (RL) by formulating decision-making as sequential
generation. However, incorporating temporal information of sequential data and
utilizing it to guide diffusion models to perform better generation is still an
open challenge. In this paper, we take one step forward to investigate
controllable generation with temporal conditions that are refined from temporal
information. We observe the importance of temporal conditions in sequential
generation in sufficient explorative scenarios and provide a comprehensive
discussion and comparison of different temporal conditions. Based on the
observations, we propose an effective temporally-conditional diffusion model
coined Temporally-Composable Diffuser (TCD), which extracts temporal
information from interaction sequences and explicitly guides generation with
temporal conditions. Specifically, we separate the sequences into three parts
according to time expansion and identify historical, immediate, and prospective
conditions accordingly. Each condition preserves non-overlapping temporal
information of sequences, enabling more controllable generation when we jointly
use them to guide the diffuser. Finally, we conduct extensive experiments and
analysis to reveal the favorable applicability of TCD in offline RL tasks,
where our method reaches or matches the best performance compared with prior
SOTA baselines.
- Abstract(参考訳): 最近の研究は、コンピュータビジョンと自然言語処理における拡散モデルの可能性を示している。
古典的な教師付き学習分野とは別に、拡散モデルは、逐次生成としての意思決定を定式化することによって強化学習(RL)において強い競争力を示す。
しかし、逐次データの時間情報を導入し、拡散モデルを用いてより良い生成を行うことは、まだ未解決の課題である。
本稿では,時間的情報から洗練された時間的条件による制御可能な生成について検討する。
十分な探索シナリオにおける逐次生成における時間条件の重要性を観察し,その包括的考察と時間条件の比較を行った。
そこで本研究では, 相互作用列から時間情報を抽出し, 時間的条件を明示した時間拡散モデルであるtcdを提案する。
具体的には, 時系列を時間展開に応じて3つの部分に分け, 歴史的条件, 即時条件, 予測条件を識別する。
各条件は、配列の重複しない時間情報を保存し、ディフューザのガイドに共同で使用すると、より制御可能な生成を可能にする。
最後に,tcdのオフラインrlタスクへの適用性を明らかにするために広範な実験と分析を行い,本手法が以前のsataベースラインと比較して最高の性能に到達あるいは適合することを示す。
関連論文リスト
- Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model [66.91323540178739]
シークエンシャルレコメンデーション(SR)は、ユーザーが過去の行動に基づいて興味を持つかもしれない項目を予測することを目的としている。
我々はSRを新しい情報理論の観点から再検討し、逐次モデリング手法がユーザの行動のランダム性と予測不可能性を適切に把握できないことを発見した。
ファジィ情報処理理論に触発された本論文では,制限を克服し,ユーザの関心事の進化をよりよく捉えるために,ファジィなインタラクションシーケンスの組を導入する。
論文 参考訳(メタデータ) (2024-10-31T14:52:01Z) - Retrieval-Augmented Diffusion Models for Time Series Forecasting [19.251274915003265]
検索時間拡張拡散モデル(RATD)を提案する。
RATDは埋め込みベースの検索プロセスと参照誘導拡散モデルという2つの部分から構成される。
当社のアプローチでは,データベース内の意味のあるサンプルを活用することで,サンプリングを支援し,データセットの利用を最大化することが可能です。
論文 参考訳(メタデータ) (2024-10-24T13:14:39Z) - Channel-aware Contrastive Conditional Diffusion for Multivariate Probabilistic Time Series Forecasting [19.383395337330082]
本稿では,CCDM(Contrastive Conditional Diffusion)モデルを提案する。
提案したCCDMは,現在最先端の拡散予測器と比較して優れた予測能力を示すことができる。
論文 参考訳(メタデータ) (2024-10-03T03:13:15Z) - Leveraging Priors via Diffusion Bridge for Time Series Generation [3.2066708654182743]
時系列生成はシミュレーション、データ拡張、仮説テスト技術といった実世界のアプリケーションで広く利用されている。
拡散モデルは、時系列生成のデファクトアプローチとして現れています。
TimeBridgeは、拡散ブリッジを活用してフレキシブルな合成を可能にするフレームワークで、選択した事前とデータ分散の間のトランスポートを学習する。
論文 参考訳(メタデータ) (2024-08-13T06:47:59Z) - A Survey on Diffusion Models for Time Series and Spatio-Temporal Data [92.1255811066468]
時系列およびS時間データにおける拡散モデルの使用について概観し、それらをモデル、タスクタイプ、データモダリティ、実用的なアプリケーションドメインで分類する。
我々は拡散モデルを無条件型と条件付き型に分類し、時系列とS時間データを別々に議論する。
本調査は,医療,レコメンデーション,気候,エネルギー,オーディオ,交通など,さまざまな分野の応用を幅広くカバーしている。
論文 参考訳(メタデータ) (2024-04-29T17:19:40Z) - A Temporally Disentangled Contrastive Diffusion Model for Spatiotemporal Imputation [35.46631415365955]
C$2$TSDという条件拡散フレームワークを導入する。
実世界の3つのデータセットに対する我々の実験は、最先端のベースラインと比較して、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2024-02-18T11:59:04Z) - Add and Thin: Diffusion for Temporal Point Processes [24.4686728569167]
ADD-THINは、時間点過程(TPP)ネットワークの確率的デノナイジング拡散モデルである。
イベントシーケンス全体で動作し、密度推定において最先端のTPPモデルと一致する。
合成および実世界のデータセットの実験において、我々のモデルは密度推定における最先端のTPPモデルと一致し、予測においてそれらを強く上回る。
論文 参考訳(メタデータ) (2023-11-02T10:42:35Z) - Generative Time Series Forecasting with Diffusion, Denoise, and
Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。
実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。
本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2023-01-08T12:20:46Z) - Generic Temporal Reasoning with Differential Analysis and Explanation [61.96034987217583]
時間差分解析でギャップを埋めるTODAYという新しいタスクを導入する。
TODAYは、システムがインクリメンタルな変化の効果を正しく理解できるかどうかを評価する。
共同学習においてTODAYの指導スタイルと説明アノテーションが有効であることを示す。
論文 参考訳(メタデータ) (2022-12-20T17:40:03Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。