Fugu-MT 論文翻訳(概要): Development of modeling and control strategies for an approximated Gaussian process

論文の概要: Development of modeling and control strategies for an approximated Gaussian process

arxiv url: http://arxiv.org/abs/2002.05105v1
Date: Wed, 12 Feb 2020 17:28:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-01 19:47:26.526861
Title: Development of modeling and control strategies for an approximated Gaussian process
Title（参考訳）: 近似ガウス過程のモデリングと制御戦略の開発
Authors: Shisheng Cui and Chia-Jung Chang
Abstract要約: 本稿では,ガウス過程(GP)モデルを近似する線形モデルを提案する。このモデルは一連の基底関数によってGPモデルを拡張する。提案した線形モデルにより制御戦略が提供される。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The Gaussian process (GP) model, which has been extensively applied as priors of functions, has demonstrated excellent performance. The specification of a large number of parameters affects the computational efficiency and the feasibility of implementation of a control strategy. We propose a linear model to approximate GPs; this model expands the GP model by a series of basis functions. Several examples and simulation studies are presented to demonstrate the advantages of the proposed method. A control strategy is provided with the proposed linear model.
Abstract（参考訳）: 関数の先行として広く適用されてきたガウス過程(GP)モデルは優れた性能を示した。多数のパラメータの仕様は、計算効率と制御戦略の実装可能性に影響を及ぼす。 GPを近似する線形モデルを提案し、このモデルは一連の基底関数によってGPモデルを拡張する。提案手法の利点を示すために,いくつかの例とシミュレーション研究を行った。制御戦略には線形モデルが提案されている。

関連論文リスト

GRPO-RM: Fine-Tuning Representation Models via GRPO-Driven Reinforcement Learning [52.16150076582931]
我々は、表現モデル(GRPO-RM)のためのグループ相対ポリシー最適化を提案する。我々の手法は,大規模言語モデル(LLM)におけるトークンシーケンスサンプリングを機能的に置き換えるための事前定義された出力セットを確立する。特殊報酬関数は表現モデルの性質を満たすように設計されている。
論文参考訳（メタデータ） (2025-11-19T09:19:39Z)
Leveraging Submodule Linearity Enhances Task Arithmetic Performance in LLMs [51.09983600916971]
近年の研究では、線形性を示すモデルがタスク演算の性能を向上させることが示されている。我々は、この線型性はモデルの部分加群の中にすでに存在すると論じる。我々はこれらのサブモジュールを独立にマージする革新的なモデルマージ戦略を提案する。
論文参考訳（メタデータ） (2025-04-15T06:23:24Z)
Smart Exploration in Reinforcement Learning using Bounded Uncertainty Models [0.0]
本稿では、事前モデル知識を用いて探索過程をガイドし、強化学習を高速化することを提案する。我々は,Q-函数の最適Q-函数への収束に関する理論的保証を,探索政策のクラスとして提案する。
論文参考訳（メタデータ） (2025-04-08T12:33:38Z)
Unifying Model Predictive Path Integral Control, Reinforcement Learning, and Diffusion Models for Optimal Control and Planning [6.871390204787483]
我々は,Gibs測度の勾配に基づく最適化により,MPPI,RL,拡散モデルを結ぶ統一的な視点を確立する。まず,MPPIをスムーズなエネルギー関数上の勾配上昇として解釈できることを示す。次に、目的関数に指数変換を適用することにより、ポリシー勾配法がMPPIに還元されることを実証する。
論文参考訳（メタデータ） (2025-02-27T19:26:36Z)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文参考訳（メタデータ） (2024-10-17T17:59:02Z)
Model-Free Active Exploration in Reinforcement Learning [53.786439742572995]
強化学習における探索問題について検討し,新しいモデルフリーソリューションを提案する。我々の戦略は、最先端の探査アプローチよりも高速に効率的な政策を特定できる。
論文参考訳（メタデータ） (2024-06-30T19:00:49Z)
Polynomial Chaos Expanded Gaussian Process [2.287415292857564]
複雑で未知のプロセスでは、大域的モデルは最初実験空間全体にわたって生成される。本研究では,グローバルな実験空間とローカルな実験空間の両方を効果的に表現するモデルの必要性に対処する。
論文参考訳（メタデータ） (2024-05-02T07:11:05Z)
Model-based Reinforcement Learning for Parameterized Action Spaces [11.94388805327713]
PAMDPのためのモデルベース強化学習アルゴリズムを提案する。エージェントはパラメータ化されたアクション条件付き力学モデルを学び、修正されたモデル予測経路積分制御で計画する。いくつかの標準ベンチマークにおける実験結果から,本アルゴリズムは最先端のPAMDP法よりも優れたサンプリング効率と性能を実現することが示された。
論文参考訳（メタデータ） (2024-04-03T19:48:13Z)
Model-Based Reparameterization Policy Gradient Methods: Theory and Practical Algorithms [88.74308282658133]
Reization (RP) Policy Gradient Methods (PGM) は、ロボット工学やコンピュータグラフィックスにおける連続的な制御タスクに広く採用されている。近年の研究では、長期強化学習問題に適用した場合、モデルベースRP PGMはカオス的かつ非滑らかな最適化環境を経験する可能性があることが示されている。本稿では,長期モデルアンロールによる爆発的分散問題を緩和するスペクトル正規化法を提案する。
論文参考訳（メタデータ） (2023-10-30T18:43:21Z)
When to Update Your Model: Constrained Model-based Reinforcement Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文参考訳（メタデータ） (2022-10-15T17:57:43Z)
Sparse high-dimensional linear regression with a partitioned empirical Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。提案手法はRパッケージプローブに実装されている。
論文参考訳（メタデータ） (2022-09-16T19:15:50Z)
Locally Interpretable Model Agnostic Explanations using Gaussian Processes [2.9189409618561966]
LIME(Local Interpretable Model-Agnostic Explanations)は、単一インスタンスの予測を説明する一般的なテクニックである。局所的解釈可能なモデルのガウス過程(GP)に基づくバリエーションを提案する。提案手法は,LIMEに比べてはるかに少ないサンプルを用いて忠実な説明を生成可能であることを示す。
論文参考訳（メタデータ） (2021-08-16T05:49:01Z)
Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文参考訳（メタデータ） (2020-07-11T19:44:09Z)
Transport Gaussian Processes for Regression [0.22843885788439797]
本稿では,GP,ワープGP,学生プロセスなどを含むプロセス構築手法を提案する。私たちのアプローチはレイヤベースのモデルにインスパイアされ、各レイヤが生成されたプロセス上で特定のプロパティを変更する。実世界のデータを用いた実験により,提案モデルの有効性を検証した。
論文参考訳（メタデータ） (2020-01-30T17:44:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。