論文の概要: Distributional Active Inference
- arxiv url: http://arxiv.org/abs/2601.20985v1
- Date: Wed, 28 Jan 2026 19:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.402862
- Title: Distributional Active Inference
- Title(参考訳): 分布能動推論
- Authors: Abdullah Akgül, Gulcin Baykal, Manuel Haußmann, Mustafa Mert Çelikok, Melih Kandemir,
- Abstract要約: 本稿では,モデルベース,分布型,モデルフリーなアプローチにまたがる強化学習アルゴリズムの形式的抽象化を提案する。
この抽象化は、能動推論を分散強化学習フレームワークにシームレスに統合し、トランジッション・ダイナミクス・モデリングを使わずにその性能上の優位性を実現する。
- 参考スコア(独自算出の注目度): 11.60734837821471
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optimal control of complex environments with robotic systems faces two complementary and intertwined challenges: efficient organization of sensory state information and far-sighted action planning. Because the reinforcement learning framework addresses only the latter, it tends to deliver sample-inefficient solutions. Active inference is the state-of-the-art process theory that explains how biological brains handle this dual problem. However, its applications to artificial intelligence have thus far been limited to extensions of existing model-based approaches. We present a formal abstraction of reinforcement learning algorithms that spans model-based, distributional, and model-free approaches. This abstraction seamlessly integrates active inference into the distributional reinforcement learning framework, making its performance advantages accessible without transition dynamics modeling.
- Abstract(参考訳): ロボットシステムによる複雑な環境の最適制御は、感覚状態情報の効率的な組織化と遠目行動計画という、2つの相補的かつ相互に連携する課題に直面している。
強化学習フレームワークは後者にのみ対応するため、サンプル非効率なソリューションを提供する傾向がある。
アクティブ推論(Active Inference)は、生物学的脳がこの二重問題をどのように扱うかを説明する最先端のプロセス理論である。
しかし、人工知能へのその応用は、これまでのところ、既存のモデルベースのアプローチの拡張に限られている。
本稿では,モデルベース,分布型,モデルフリーなアプローチにまたがる強化学習アルゴリズムの形式的抽象化を提案する。
この抽象化は、能動推論を分散強化学習フレームワークにシームレスに統合し、トランジッション・ダイナミクス・モデリングを使わずにその性能上の優位性を実現する。
関連論文リスト
- Feature-Based vs. GAN-Based Learning from Demonstrations: When and Why [50.191655141020505]
この調査は、デモから学ぶ機能ベースのアプローチとGANベースのアプローチの比較分析を提供する。
特徴に基づく手法とGANに基づく手法の2分法はますます曖昧になっていると我々は主張する。
論文 参考訳(メタデータ) (2025-07-08T11:45:51Z) - Autonomous Option Invention for Continual Hierarchical Reinforcement Learning and Planning [21.737035951695887]
本稿では,選択肢を考案し,表現し,活用するための新しいアプローチを提案する。
我々のアプローチは、長い地平線、スパース報酬、未知の遷移と報酬関数によって特徴づけられる問題に対処する。
我々の主な貢献は、シンボル表現を伴う移動可能で一般化可能な選択肢を継続的に学習するためのアプローチである。
論文 参考訳(メタデータ) (2024-12-20T23:04:52Z) - Demonstrating the Continual Learning Capabilities and Practical Application of Discrete-Time Active Inference [0.0]
アクティブ推論は、エージェントが環境とどのように相互作用するかを理解するための数学的フレームワークである。
本稿では,個別の時間環境で動作するエージェントのための連続学習フレームワークを提案する。
我々は、エージェントがモデルを再学習し、効率的に洗練する能力を示し、金融や医療といった複雑な分野に適合する。
論文 参考訳(メタデータ) (2024-09-30T21:18:46Z) - Learning in Hybrid Active Inference Models [0.8749675983608172]
本稿では,高レベル離散型アクティブ・推論・プランナを低レベル連続型アクティブ・推論・コントローラの上に置く階層型ハイブリッド・アクティブ・推論・エージェントを提案する。
我々は、意味のある離散表現のエンドツーエンド学習を実装する線形力学系をリカレントに切り替えるという最近の研究を活用している。
当社のモデルを,探索と計画成功による高速なシステム識別を実証し,スパースな連続マウンテンカータスクに適用する。
論文 参考訳(メタデータ) (2024-09-02T08:41:45Z) - Explainable Deep Learning Framework for Human Activity Recognition [3.9146761527401424]
本稿では,HARモデルの解釈性と有効性を高めるモデル非依存フレームワークを提案する。
競争力のあるデータ拡張を実装することで、我々のフレームワークはモデル決定の直感的でアクセスしやすい説明を提供する。
論文 参考訳(メタデータ) (2024-08-21T11:59:55Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Learning to Generate All Feasible Actions [4.333208181196761]
アクションマッピングは、学習プロセスを2つのステップに分割する新しいアプローチである。
本稿では、実現可能性モデルの自己教師型クエリにより、実現可能なすべてのアクションを生成することを学ぶことで、実現可能性部分に焦点を当てる。
エージェントが接続不能な実行可能なアクションセット間でアクションを生成する能力を示す。
論文 参考訳(メタデータ) (2023-01-26T23:15:51Z) - Causal Dynamics Learning for Task-Independent State Abstraction [61.707048209272884]
タスク独立状態抽象化(CDL)のための因果ダイナミクス学習を導入する。
CDLは、状態変数とアクションの間の不要な依存関係を取り除く理論的に証明された因果ダイナミクスモデルを学ぶ。
状態抽象化は、学習されたダイナミクスから導き出すことができる。
論文 参考訳(メタデータ) (2022-06-27T17:02:53Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。