論文の概要: Active Constraint Learning in High Dimensions from Demonstrations
- arxiv url: http://arxiv.org/abs/2512.22757v1
- Date: Sun, 28 Dec 2025 03:06:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.206734
- Title: Active Constraint Learning in High Dimensions from Demonstrations
- Title(参考訳): デモから高次元のアクティブ制約学習
- Authors: Zheng Qiu, Chih-Yuan Chiu, Glen Chou,
- Abstract要約: 本稿では,実演者の環境における未知の制約を推定するために,情報伝達系を用いた反復的能動制約学習(ACL)アルゴリズムを提案する。
提案手法は,未知の制約を表現するために利用可能な実演データセット上のガウス過程 (GP) を反復的に訓練し,その結果のGP後処理を用いて開始/終了状態のクエリを行い,データセットに追加される情報的な実演を生成する。
高次元非線形力学と未知の非線形制約を用いたシミュレーションおよびハードウェア実験において、本手法は、反復的に生成されたスパースかつ情報的デモンストレーションの集合からの制約推論を正確に行うために、ベースラインのランダムサンプリングに基づく手法より優れている。
- 参考スコア(独自算出の注目度): 4.687435652406819
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an iterative active constraint learning (ACL) algorithm, within the learning from demonstrations (LfD) paradigm, which intelligently solicits informative demonstration trajectories for inferring an unknown constraint in the demonstrator's environment. Our approach iteratively trains a Gaussian process (GP) on the available demonstration dataset to represent the unknown constraints, uses the resulting GP posterior to query start/goal states, and generates informative demonstrations which are added to the dataset. Across simulation and hardware experiments using high-dimensional nonlinear dynamics and unknown nonlinear constraints, our method outperforms a baseline, random-sampling based method at accurately performing constraint inference from an iteratively generated set of sparse but informative demonstrations.
- Abstract(参考訳): 本稿では,実証実験(LfD)パラダイムの学習において,実証者の環境における未知の制約を推定するために,情報的実証軌道を知的に導出する反復的アクティブ制約学習(ACL)アルゴリズムを提案する。
提案手法は,未知の制約を表現するために利用可能な実演データセット上のガウス過程(GP)を反復的に訓練し,その結果のGP後部を用いて開始/終了状態のクエリを行い,データセットに追加される情報的な実演を生成する。
高次元非線形力学と未知の非線形制約を用いたシミュレーションおよびハードウェア実験において、本手法は、反復的に生成されたスパースかつ情報的デモンストレーションの集合からの制約推論を正確に行うために、ベースラインのランダムサンプリングに基づく手法より優れている。
関連論文リスト
- Reinforcement learning based data assimilation for unknown state model [3.032674692886751]
本研究では,強化学習とアンサンブルに基づくベイジアン・ファルトリング手法を組み合わせた新しい手法を提案する。
提案フレームワークは, 非線形および部分観測計測モデルを含む, 幅広い観測シナリオに対応している。
いくつかの数値的な例では,提案手法は高次元設定における精度とロバスト性を向上することを示した。
論文 参考訳(メタデータ) (2025-11-04T05:58:37Z) - Inverse-RLignment: Large Language Model Alignment from Demonstrations through Inverse Reinforcement Learning [62.05713042908654]
本稿では,これらの課題を克服するために,高品質な実演データを活用する新しいアプローチであるAlignment from Demonstrations (AfD)を紹介する。
AfDをシーケンシャルな意思決定フレームワークで形式化し、報酬信号の欠如というユニークな課題を強調します。
そこで本研究では,AfD に適した報酬モデル上で補間を行う計算効率のよいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-24T15:13:53Z) - Stochastic Nonlinear Control via Finite-dimensional Spectral Dynamic Embedding [20.43835169613882]
本稿では,非線形系の最適制御のためのスペクトルダイナミクス埋め込み制御(SDEC)を提案する。
これはシステムの非線形力学によって誘導される無限次元の特徴表現を明らかにし、状態-作用値関数の線形表現を可能にする。
実用的な実装では、この表現は有限次元のトランケーションを用いて近似される。
論文 参考訳(メタデータ) (2023-04-08T04:23:46Z) - Bayesian Spline Learning for Equation Discovery of Nonlinear Dynamics
with Quantified Uncertainty [8.815974147041048]
本研究では,非線形(時空間)力学の擬似的支配方程式を,定量化された不確実性を伴うスパースノイズデータから同定する枠組みを開発した。
提案アルゴリズムは、正準常微分方程式と偏微分方程式によって制御される複数の非線形力学系に対して評価される。
論文 参考訳(メタデータ) (2022-10-14T20:37:36Z) - Deep Active Learning with Noise Stability [24.54974925491753]
ラベルのないデータの不確実性推定は、アクティブな学習に不可欠である。
本稿では,雑音の安定性を利用して不確実性を推定する新しいアルゴリズムを提案する。
本手法はコンピュータビジョン,自然言語処理,構造データ解析など,様々なタスクに適用可能である。
論文 参考訳(メタデータ) (2022-05-26T13:21:01Z) - Likelihood-Free Inference in State-Space Models with Unknown Dynamics [71.94716503075645]
本研究では、状態空間モデルにおいて、観測をシミュレートすることしかできず、遷移ダイナミクスが不明な潜在状態の推測と予測を行う手法を提案する。
本研究では,限られた数のシミュレーションで状態予測と状態予測を行う手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T12:33:42Z) - The Neural Network shifted-Proper Orthogonal Decomposition: a Machine
Learning Approach for Non-linear Reduction of Hyperbolic Equations [0.0]
本研究では,統計的学習フレームワークにおいて,正しい前処理変換を自動的に検出する問題にアプローチする。
純粋にデータ駆動方式により、線形部分空間操作の既存のアプローチを未知の対流場を持つ非線形双曲問題に一般化することができる。
提案アルゴリズムは、その性能をベンチマークするために単純なテストケースに対して検証され、その後、多相シミュレーションに成功している。
論文 参考訳(メタデータ) (2021-08-14T15:13:35Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Learning Constraints from Locally-Optimal Demonstrations under Cost
Function Uncertainty [6.950510860295866]
本稿では,最適化されたコスト関数が学習者に不確実な地域最適実証からパラメトリック制約を学習するアルゴリズムを提案する。
本手法では、混合整数線形プログラム(MILP)における実演のKKT最適条件を用いて、実演の局所的最適性に整合した制約を学習する。
7-DOFアームと四重項の制約を学習することで高次元制約とシステムの評価を行い、競合する制約学習手法よりも優れており、環境における新しい制約満足軌道の計画に効果的に利用できることを示す。
論文 参考訳(メタデータ) (2020-01-25T15:57:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。