論文の概要: Towards autonomous artificial agents with an active self: modeling sense
of control in situated action
- arxiv url: http://arxiv.org/abs/2112.05577v1
- Date: Fri, 10 Dec 2021 14:45:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 15:28:51.110472
- Title: Towards autonomous artificial agents with an active self: modeling sense
of control in situated action
- Title(参考訳): 能動的自己を持つ自律型人工エージェントを目指して--位置行動における制御感覚のモデル化
- Authors: Sebastian Kahl, Sebastian Wiese, Nele Russwinkel, Stefan Kopp
- Abstract要約: 人工エージェントにおける能動自己の計算モデルについて述べる。
我々は、エージェントが制御感覚を装備できる方法と、それが自律的な位置行動でどのように起こるかに焦点を当てる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we present a computational modeling account of an active self
in artificial agents. In particular we focus on how an agent can be equipped
with a sense of control and how it arises in autonomous situated action and, in
turn, influences action control. We argue that this requires laying out an
embodied cognitive model that combines bottom-up processes (sensorimotor
learning and fine-grained adaptation of control) with top-down processes
(cognitive processes for strategy selection and decision-making). We present
such a conceptual computational architecture based on principles of predictive
processing and free energy minimization. Using this general model, we describe
how a sense of control can form across the levels of a control hierarchy and
how this can support action control in an unpredictable environment. We present
an implementation of this model as well as first evaluations in a simulated
task scenario, in which an autonomous agent has to cope with un-/predictable
situations and experiences corresponding sense of control. We explore different
model parameter settings that lead to different ways of combining low-level and
high-level action control. The results show the importance of appropriately
weighting information in situations where the need for low/high-level action
control varies and they demonstrate how the sense of control can facilitate
this.
- Abstract(参考訳): 本稿では,人工エージェントにおけるアクティブ自己の計算モデルについて述べる。
特に,自律的位置決め行動においてエージェントがどのように制御の感覚を組み込むことができるか,どのようにしてエージェントが自律的位置決め行動に現れるか,そしてその制御に影響を及ぼすかに焦点を当てる。
これはボトムアッププロセス(感覚運動学習と制御のきめ細かい適応)とトップダウンプロセス(戦略選択と意思決定のための認知プロセス)を組み合わせた具体化された認知モデルを構築する必要があると論じている。
本稿では,予測処理と自由エネルギー最小化の原理に基づく概念計算アーキテクチャを提案する。
この一般的なモデルを用いて、制御階層のレベルにわたって制御の感覚がどのように形成され、予測不可能な環境でアクション制御をサポートするかを記述する。
本稿では, 自律エージェントが予測不能な状況に対処し, 対応する制御感覚に対処しなければならないシミュレーションタスクシナリオにおいて, このモデルの実装と最初の評価を行う。
低レベルと高レベルのアクション制御を組み合わせる方法が異なるモデルパラメータの設定について検討する。
その結果,低レベル・高レベルな行動制御の必要性が変化する状況において,情報を適切に重み付けすることの重要性が示された。
関連論文リスト
- Scenario-based Thermal Management Parametrization Through Deep Reinforcement Learning [0.4218593777811082]
本稿では,熱管理機能に対する学習に基づくチューニング手法を提案する。
我々の深層強化学習エージェントは、チューニングタスクコンテキストを処理し、組込みパラメータセットのイメージベースの解釈を組み込む。
本稿では,バルブ制御器のパラメトリゼーションタスクへの適用性を実証し,実際の車両試験で検証する。
論文 参考訳(メタデータ) (2024-08-04T13:19:45Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - ControlVAE: Model-Based Learning of Generative Controllers for
Physics-Based Characters [28.446959320429656]
可変オートエンコーダ(VAE)に基づく生成動作制御ポリシーを学習するためのモデルベースのフレームワークであるControlVAEを紹介する。
我々のフレームワークは、多種多様な非組織的な動作シーケンスから、リッチで柔軟なスキル表現と、スキル条件付き生成制御ポリシーを学習することができる。
シミュレーション文字のリアルかつインタラクティブな制御を可能にする多種多様なタスクセットを用いた制御VAEの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-12T10:11:36Z) - Meta-Reinforcement Learning for Adaptive Control of Second Order Systems [3.131740922192114]
プロセス制御では、多くのシステムは類似しており、よく理解されているダイナミクスを持ち、メタ学習を通じて一般化可能なコントローラを作成することは可能であることを示唆している。
本稿では,メタ強化学習(meta-RL)制御戦略を定式化し,モデル構造などのトレーニングにおいて,既知のオフライン情報を活用する。
重要な設計要素は、トレーニング中にモデルベースの情報をオフラインで利用し、新しい環境と対話するためのモデルフリーのポリシー構造を維持することである。
論文 参考訳(メタデータ) (2022-09-19T18:51:33Z) - Isolating and Leveraging Controllable and Noncontrollable Visual
Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。
まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。
第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文 参考訳(メタデータ) (2022-05-27T08:07:39Z) - Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust [0.2770822269241973]
未知の条件下でのナビゲーション問題は、制御分野において最も重要でよく研究されている問題の一つである。
近年のモデルフリー適応制御法は, センサフィードバックから直接植物の物理的特性を学習することにより, この依存を除去することを目的としている。
提案手法は,深い強化学習フレームワークによって頑健に調整された完全状態フィードバックコントローラからなる,概念的にシンプルな学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2021-01-29T10:13:56Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - From proprioception to long-horizon planning in novel environments: A
hierarchical RL model [4.44317046648898]
本稿では,異なるタイプの推論を反映した,単純で3段階の階層型アーキテクチャを提案する。
本手法をMujoco Ant環境における一連のナビゲーションタスクに適用する。
論文 参考訳(メタデータ) (2020-06-11T17:19:12Z) - Goal-Conditioned End-to-End Visuomotor Control for Versatile Skill
Primitives [89.34229413345541]
本稿では,制御器とその条件をエンドツーエンドに学習することで,落とし穴を回避する条件付け手法を提案する。
本モデルでは,ロボットの動きのダイナミックな画像表現に基づいて,複雑な動作シーケンスを予測する。
代表的MPCおよびILベースラインに対するタスク成功の大幅な改善を報告した。
論文 参考訳(メタデータ) (2020-03-19T15:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。