論文の概要: A Framework for Characterizing Novel Environment Transformations in
General Environments
- arxiv url: http://arxiv.org/abs/2305.04315v1
- Date: Sun, 7 May 2023 15:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 16:32:11.295357
- Title: A Framework for Characterizing Novel Environment Transformations in
General Environments
- Title(参考訳): 一般環境における新しい環境変容を特徴付ける枠組み
- Authors: Matthew Molineaux, Dustin Dannenhauer, Eric Kildebeck
- Abstract要約: 環境変換の定義と分類のための形式的および理論的枠組みを導入する。
ドメイン、シナリオジェネレータ、変換を記述するための新しい言語を提案する。
環境変換の8つのカテゴリに対して、最初の形式的および計算的なテストセットを提供する。
- 参考スコア(独自算出の注目度): 3.0938904602244346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To be robust to surprising developments, an intelligent agent must be able to
respond to many different types of unexpected change in the world. To date,
there are no general frameworks for defining and characterizing the types of
environment changes that are possible. We introduce a formal and theoretical
framework for defining and categorizing environment transformations, changes to
the world an agent inhabits. We introduce two types of environment
transformation: R-transformations which modify environment dynamics and
T-transformations which modify the generation process that produces scenarios.
We present a new language for describing domains, scenario generators, and
transformations, called the Transformation and Simulator Abstraction Language
(T-SAL), and a logical formalism that rigorously defines these concepts. Then,
we offer the first formal and computational set of tests for eight categories
of environment transformations. This domain-independent framework paves the way
for describing unambiguous classes of novelty, constrained and
domain-independent random generation of environment transformations,
replication of environment transformation studies, and fair evaluation of agent
robustness.
- Abstract(参考訳): 驚くべき発展にロバストであるためには、インテリジェントエージェントは、世界中の予期せぬ多くの変化に対応できなければならない。
現在、可能な環境変化の種類を定義し、特徴付けるための一般的なフレームワークはありません。
我々は,エージェントが居住する世界における環境変化を定義し,分類するための形式的かつ理論的枠組みを提案する。
本稿では,環境動態を変化させるR変換とシナリオを生成する生成プロセスを変更するT変換の2種類を紹介する。
我々は、t-sal(transform and simulator abstraction language)と呼ばれる、ドメイン、シナリオジェネレータ、および変換を記述するための新しい言語と、これらの概念を厳密に定義する論理形式を提案する。
次に、環境変換の8つのカテゴリに対して、最初の形式的および計算的なテストセットを提供する。
このドメイン非依存フレームワークは、新規性、制約付きおよびドメイン非依存の環境変換のランダム生成、環境変換研究の複製、エージェントロバストネスの公平な評価の曖昧なクラスを記述する方法を提供する。
関連論文リスト
- Towards Generalizable Reinforcement Learning via Causality-Guided Self-Adaptive Representations [22.6449779859417]
汎用インテリジェンスには、タスク間の迅速な適応が必要です。
本稿では,分布だけでなく,環境空間も変化するシナリオを幅広く検討する。
我々はCSRと呼ばれる因果性誘導型自己適応表現に基づく手法を導入し、エージェントを効果的に一般化させる。
論文 参考訳(メタデータ) (2024-07-30T08:48:49Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Enhancing Evolving Domain Generalization through Dynamic Latent
Representations [47.3810472814143]
我々はMultual Information-Based Sequential Autoencoders (MISTS) と呼ばれる新しいフレームワークを提案する。
MISTSは、Mutual Information-Based Sequential Autoencoders (MISTS)と呼ばれる新しいフレームワークを通じて、動的および不変両方の機能を学ぶ
人工と実世界の両方のデータセットに対する実験結果は、MISTSが進化と不変の両方の情報を取得することに成功していることを示している。
論文 参考訳(メタデータ) (2024-01-16T16:16:42Z) - Curriculum Reinforcement Learning via Morphology-Environment
Co-Evolution [46.27211830466317]
形態-環境共進化」によるRL剤とその形態の最適化
カリキュラムを手作りする代わりに、形態と環境を自動的に変えるために2つのポリシーを訓練します。
論文 参考訳(メタデータ) (2023-09-21T22:58:59Z) - An Adaptive Deep RL Method for Non-Stationary Environments with
Piecewise Stable Context [109.49663559151377]
未知の環境コンテキストへの適応に関する既存の作業は、コンテキストが全エピソードで同じであると仮定するか、コンテキスト変数がマルコフ的であると仮定するかのどちらかである。
本稿では,textittextbfSegmented textbfContext textbfBelief textbfAugmented textbfDeep(SeCBAD) RL法を提案する。
提案手法は,潜在コンテキスト上の信念分布と後方セグメント長とを共同で推定し,観測データを用いたより正確な信念コンテキスト推定を行う。
論文 参考訳(メタデータ) (2022-12-24T13:43:39Z) - REPTILE: A Proactive Real-Time Deep Reinforcement Learning Self-adaptive
Framework [0.6335848702857039]
動作環境の変化に応じて動作を適応できるソフトウェアシステムの開発を支援するための一般的なフレームワークが提案されている。
提案されたアプローチはREPTILEと呼ばれ、完全にプロアクティブな方法で動作し、イベントに反応するためにDeep Reinforcement Learningベースのエージェントに依存する。
本フレームワークでは、コンテキスト/環境に関するものと、物理的なアーキテクチャそのものに関するものとの2つのタイプのノベルティを考慮に入れている。
このフレームワークは、その発生前にこれらの新規性を予測し、環境の時間変化モデルを抽出し、適切なマルコフ決定プロセスを使用してリアルタイム設定に対処する。
論文 参考訳(メタデータ) (2022-03-28T12:38:08Z) - AdaRL: What, Where, and How to Adapt in Transfer Reinforcement Learning [18.269412736181852]
我々はAdaRLと呼ばれる適応RLの原理的フレームワークを提案し、ドメイン間の変化に確実に適応する。
AdaRLは、ターゲットドメインでさらなるポリシー最適化を行うことなく、少数のサンプルでポリシーを適応できることを示す。
本稿では,AdaRLがCartpole と Atari の異なるコンポーネントに変化をもたらすための一連の実験を通じて有効性を示す。
論文 参考訳(メタデータ) (2021-07-06T16:56:25Z) - Emergent Complexity and Zero-shot Transfer via Unsupervised Environment
Design [121.73425076217471]
本研究では,未知のパラメータを持つ環境を提供するUnsupervised Environment Design (UED)を提案する。
プロタゴニスト・アンタゴニストによるレグレト環境デザイン(PAIRED)と呼ぶ。
実験により, PAIREDは複雑な環境の自然なカリキュラムを生産し, PAIREDエージェントは, 高度に新規な環境での試験において, 高いゼロショット転送性能が得られることを示した。
論文 参考訳(メタデータ) (2020-12-03T17:37:01Z) - Variational Transformers for Diverse Response Generation [71.53159402053392]
変分変換器(VT)は、変分自己注意フィードフォワードシーケンスモデルである。
VTはトランスフォーマーの並列化性と大域的受容場計算とCVAEの変動特性を組み合わせる。
本稿では,1)大域潜伏変数を用いた談話レベルの多様性のモデル化,2)細粒潜伏変数の列によるトランスフォーマーデコーダの拡張,の2種類のVTについて検討する。
論文 参考訳(メタデータ) (2020-03-28T07:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。