Fugu-MT 論文翻訳(概要): Intrinsic Motivation in Dynamical Control Systems

論文の概要: Intrinsic Motivation in Dynamical Control Systems

arxiv url: http://arxiv.org/abs/2301.00005v1
Date: Thu, 29 Dec 2022 05:20:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-03 14:27:11.283832
Title: Intrinsic Motivation in Dynamical Control Systems
Title（参考訳）: 動的制御系における固有モチベーション
Authors: Stas Tiomkin, Ilya Nemenman, Daniel Polani, Naftali Tishby
Abstract要約: エージェントのエンパワーメントの最大化に基づく本質的なモチベーションに対する情報理論的アプローチについて検討する。このアプローチは、本質的なモチベーションを形式化する以前の試みを一般化することを示す。これにより、実用的な人工的な本質的なモチベーションを持つコントローラーを設計するための扉が開く。
参考スコア（独自算出の注目度）: 5.635628182420597
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Biological systems often choose actions without an explicit reward signal, a phenomenon known as intrinsic motivation. The computational principles underlying this behavior remain poorly understood. In this study, we investigate an information-theoretic approach to intrinsic motivation, based on maximizing an agent's empowerment (the mutual information between its past actions and future states). We show that this approach generalizes previous attempts to formalize intrinsic motivation, and we provide a computationally efficient algorithm for computing the necessary quantities. We test our approach on several benchmark control problems, and we explain its success in guiding intrinsically motivated behaviors by relating our information-theoretic control function to fundamental properties of the dynamical system representing the combined agent-environment system. This opens the door for designing practical artificial, intrinsically motivated controllers and for linking animal behaviors to their dynamical properties.
Abstract（参考訳）: 生物学的システムは、しばしば明示的な報酬信号(本質的動機として知られる現象)なしで行動を選択する。この行動の根底にある計算原理はいまだに理解されていない。本研究では,エージェントのエンパワーメント(過去の行動と将来の状態の相互情報)の最大化に基づく,本質的な動機づけに対する情報理論的アプローチを検討する。我々は,本手法が本質的動機づけを形式化する以前の試みを一般化することを示し,必要な量を計算する計算効率の高いアルゴリズムを提供する。本手法をいくつかのベンチマーク制御問題で検証し,情報理論制御関数をエージェント環境システムを表す力学系の基本特性に関連付けることで本質的動機づけ行動の誘導に成功することを説明する。これは、実用的な人工的、本質的な動機付けのコントローラーを設計し、動物の行動と動特性を結びつけるための扉を開く。

関連論文リスト

Emergence of Goal-Directed Behaviors via Active Inference with Self-Prior [4.863927022806184]
幼児は、外部報酬基準が提供されていない場合でも、感覚刺激に手を伸ばすなど、目標指向の行動を示すことが多い。我々は「自己優先」と呼ばれるエージェント自身のマルチモーダル感覚経験のための新しい密度モデルを提案する。本研究は、エージェント自身の感覚経験によって形成される本態的に動機づけられた行動を実装し、初期発達における意図的行動の自然発生を実証する。
論文参考訳（メタデータ） (2025-04-15T11:16:27Z)
Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions [0.0]
ニューラルネットワークが動的環境におけるエージェントの行動を制御するためにどのように進化するかを検討する。レーン形成や層流のような単純な挙動は、より線形なネットワーク操作によって特徴づけられる。中程度のノイズ、広い視野、低いエージェント密度といった特定の環境パラメータは、非線形ネットワークの進化を促進する。
論文参考訳（メタデータ） (2024-10-25T17:43:00Z)
Behavior-Inspired Neural Networks for Relational Inference [3.7219180084857473]
最近の研究は、エージェント間の関係を、その身体行動の観察に基づいて分類することを学ぶ。エージェントの観測可能な振る舞いと,その動作を決定する潜在カテゴリの抽象化レベルを導入する。エージェントの身体的近さと嗜好を非線形意見力学モデルに統合し、相互排他的潜在カテゴリを特定し、エージェントの時間的進化を予測し、エージェントの身体的挙動を制御するメカニズムを提供する。
論文参考訳（メタデータ） (2024-06-20T21:36:54Z)
Learning Goal-based Movement via Motivational-based Models in Cognitive Mobile Robots [58.720142291102135]
人間は、強さと文脈に応じて行動を促進する必要がある。また、各行動の知覚的快楽に関連する嗜好も作り出します。これにより、意思決定がより複雑になり、コンテキストに応じてニーズと嗜好のバランスを取ることが求められます。
論文参考訳（メタデータ） (2023-02-20T04:52:24Z)
Intrinsic Motivation in Model-based Reinforcement Learning: A Brief Review [77.34726150561087]
本稿では,エージェントが獲得した世界モデルに基づいて,本質的な動機付けを決定するための既存の手法について考察する。提案した統合フレームワークは,学習を改善するために,世界モデルと本質的なモチベーションを用いてエージェントのアーキテクチャを記述する。
論文参考訳（メタデータ） (2023-01-24T15:13:02Z)
Inference of Affordances and Active Motor Control in Simulated Agents [0.5161531917413706]
本稿では,出力確率,時間的予測,モジュール型人工ニューラルネットワークアーキテクチャを提案する。我々のアーキテクチャは、割当マップと解釈できる潜在状態が発達していることを示す。アクティブな推論と組み合わせることで、フレキシブルでゴール指向の動作が実行可能であることを示す。
論文参考訳（メタデータ） (2022-02-23T14:13:04Z)
Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文参考訳（メタデータ） (2021-12-07T18:50:42Z)
Backprop-Free Reinforcement Learning with Active Neural Generative Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文参考訳（メタデータ） (2021-07-10T19:02:27Z)
Generative Adversarial Reward Learning for Generalized Behavior Tendency Inference [71.11416263370823]
ユーザの行動嗜好モデルのための生成的逆強化学習を提案する。我々のモデルは,差別的アクター批判ネットワークとWasserstein GANに基づいて,ユーザの行動から報酬を自動的に学習することができる。
論文参考訳（メタデータ） (2021-05-03T13:14:25Z)
First and Second Order Dynamics in a Hierarchical SOM system for Action Recognition [0.0]
本稿では,自己組織型マップの階層構造と,行動分類を学習する独自のニューラルネットワークを用いた行動認識システムを提案する。システムはkinectのような3dカメラからの入力を前処理し、関節の位置だけでなく、第1および第2次ダイナミクスに関する情報を利用する。
論文参考訳（メタデータ） (2021-04-13T09:46:40Z)
Tracking Emotions: Intrinsic Motivation Grounded on Multi-Level Prediction Error Dynamics [68.8204255655161]
目標達成に向けての進捗率と期待率の差が生じると、感情がどのように生じるかについて議論する。自己生成的・動的目標に向けた行動を生成する本質的なモチベーションアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-07-29T06:53:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。