論文の概要: Learning to Act and Observe in Partially Observable Domains
- arxiv url: http://arxiv.org/abs/2109.06076v1
- Date: Mon, 13 Sep 2021 15:51:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:27:44.344905
- Title: Learning to Act and Observe in Partially Observable Domains
- Title(参考訳): 部分観測可能な領域における行動と観察の学習
- Authors: Thomas Bolander, Nina Gierasimczuk, Andr\'es Occhipinti Liberman
- Abstract要約: 学習エージェントは、エージェントがこれまで対話したことのない部分観測可能な環境において、そのエージェントが観察できることと、その動作が環境に与える影響の両方を学習する。
我々は,学習者の観察上の制約を考慮し,直接観測可能なものや,ドメイン内で何をするかについて,可能な限り(明確に定義された意味で)学習できる学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 2.546355745924096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a learning agent in a partially observable environment, with
which the agent has never interacted before, and about which it learns both
what it can observe and how its actions affect the environment. The agent can
learn about this domain from experience gathered by taking actions in the
domain and observing their results. We present learning algorithms capable of
learning as much as possible (in a well-defined sense) both about what is
directly observable and about what actions do in the domain, given the
learner's observational constraints. We differentiate the level of domain
knowledge attained by each algorithm, and characterize the type of observations
required to reach it. The algorithms use dynamic epistemic logic (DEL) to
represent the learned domain information symbolically. Our work continues that
of Bolander and Gierasimczuk (2015), which developed DEL-based learning
algorithms based to learn domain information in fully observable domains.
- Abstract(参考訳): 学習エージェントは、エージェントがこれまで対話したことのない部分観測可能な環境において、そのエージェントが観察できることと、その動作が環境に与える影響の両方を学習する。
エージェントはこのドメインについて、ドメイン内のアクションを収集し、その結果を観察した経験から学ぶことができる。
学習者の観察的制約を考慮に入れて,観察可能なものやドメイン内のアクションについて,可能な限り(明確に定義された意味で)学習可能な学習アルゴリズムを提案する。
各アルゴリズムによって達成されるドメイン知識のレベルを区別し、到達に必要な観察の種類を特徴付ける。
アルゴリズムは動的認識論理(DEL)を用いて学習した領域情報を象徴的に表現する。
DELに基づく学習アルゴリズムを開発したBolander and Gierasimczuk (2015) は、完全に観測可能な領域でドメイン情報を学習する。
関連論文リスト
- Domain Adaptive Imitation Learning with Visual Observation [23.109405205238318]
本研究では,ドメイン適応型模擬学習を視覚的観察とともに検討し,エージェントが情報源領域における専門家のデモンストレーションを観察することでタスクを実行することを学習する。
本稿では,学習者の学習に使用できる入力観察から,ドメインに依存しない行動特徴を抽出する新しいフレームワークを提案する。
実験の結果,本手法は,領域シフトによる視覚的観察から得られた模倣学習のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-12-01T12:48:41Z) - Learn what matters: cross-domain imitation learning with task-relevant
embeddings [77.34726150561087]
自律エージェントが、異なる環境や異なるエージェントなど、異なる領域のデモンストレーションからタスクを実行することを学習する方法について検討する。
我々は、追加のデモンストレーションやさらなるドメイン知識にアクセスすることなく、クロスドメインの模倣学習を可能にするスケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-24T21:56:58Z) - Homomorphism Autoencoder -- Learning Group Structured Representations from Observed Transitions [51.71245032890532]
本研究では,世界に作用するエージェントが,それを修飾する動作と整合した感覚情報の内部表現を学習できるようにする手法を提案する。
既存の作業とは対照的に、我々のアプローチはグループの事前の知識を必要とせず、エージェントが実行可能なアクションのセットを制限しない。
論文 参考訳(メタデータ) (2022-07-25T11:22:48Z) - Provably Sample-Efficient RL with Side Information about Latent Dynamics [12.461789905893026]
本研究では,RLエージェントが状態空間の構造に関する抽象的な知識にアクセスできるような環境下での強化学習について検討する。
我々は,対象領域におけるロバストなポリシーを,地平線上にあるサンプルの複雑さで学習するTASIDというアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-27T21:07:03Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Human Activity Recognition using Attribute-Based Neural Networks and
Context Information [61.67246055629366]
手作業におけるウェアラブルセンサデータから人間の活動認識(HAR)を考察する。
我々は、コンテキスト情報をディープニューラルネットワークベースのHARシステムに体系的に組み込む方法を示す。
提案したアーキテクチャは,最先端手法と比較してHAR性能が向上することを示す。
論文 参考訳(メタデータ) (2021-10-28T06:08:25Z) - Open Domain Generalization with Domain-Augmented Meta-Learning [83.59952915761141]
オープンドメイン一般化(OpenDG)の新しい実践的問題について研究する。
本稿では,オープンドメイン一般化表現を学ぶためのメタ学習フレームワークを提案する。
種々のマルチドメインデータセットの実験結果から、提案したドメイン拡張メタラーニング(DAML)が、未確認ドメイン認識の先行手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-08T09:12:24Z) - Domain-Robust Visual Imitation Learning with Mutual Information
Constraints [0.0]
Disentangling Generative Adversarial Imitation Learning (DisentanGAIL)と呼ばれる新しいアルゴリズムを導入する。
本アルゴリズムは,タスクを実行する専門家の高次元観察から自律エージェントを直接学習することを可能にする。
論文 参考訳(メタデータ) (2021-03-08T21:18:58Z) - Domain Adapting Ability of Self-Supervised Learning for Face Recognition [0.0]
深層畳み込みネットワークは顔認識タスクにおいて大きなパフォーマンスを実現している。
ドメインの相違の課題は、現実世界のアプリケーションにまだ存在する。
本論文では,より優れた埋め込み空間を学習するために,自己監督型学習を採用する。
論文 参考訳(メタデータ) (2021-02-26T06:23:14Z) - A Quantitative Perspective on Values of Domain Knowledge for Machine
Learning [27.84415856657607]
様々な形式のドメイン知識は、学習性能を向上させる上で重要な役割を担っている。
本研究では,ドメイン知識の価値を学習性能への貢献の観点から定量化する問題について検討する。
論文 参考訳(メタデータ) (2020-11-17T06:12:23Z) - Learning from Extrinsic and Intrinsic Supervisions for Domain
Generalization [95.73898853032865]
ドメイン間を同時に一般化する方法を学ぶための新しいドメイン一般化フレームワークを提案する。
提案手法の有効性を2つの標準オブジェクト認識ベンチマークで示す。
論文 参考訳(メタデータ) (2020-07-18T03:12:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。