論文の概要: Goal Agnostic Planning using Maximum Likelihood Paths in Hypergraph
World Models
- arxiv url: http://arxiv.org/abs/2110.09442v1
- Date: Mon, 18 Oct 2021 16:22:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 14:12:09.514343
- Title: Goal Agnostic Planning using Maximum Likelihood Paths in Hypergraph
World Models
- Title(参考訳): ハイパーグラフ世界モデルにおける最適経路を用いたゴール予測計画
- Authors: Christopher Robinson
- Abstract要約: 本稿では,ハイパーグラフに基づく機械学習アルゴリズム,データ構造駆動型メンテナンス手法,およびDijkstraのアルゴリズムの確率的応用に基づく計画アルゴリズムを提案する。
このアルゴリズムが問題空間内の最適解を決定すること、数学的に有界な学習性能を証明し、時間を通してシステム状態の進行を解析する数学的モデルを提供する。
- 参考スコア(独自算出の注目度): 1.370633147306388
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we present a hypergraph--based machine learning algorithm, a
datastructure--driven maintenance method, and a planning algorithm based on a
probabilistic application of Dijkstra's algorithm. Together, these form a goal
agnostic automated planning engine for an autonomous learning agent which
incorporates beneficial properties of both classical Machine Learning and
traditional Artificial Intelligence. We prove that the algorithm determines
optimal solutions within the problem space, mathematically bound learning
performance, and supply a mathematical model analyzing system state progression
through time yielding explicit predictions for learning curves, goal
achievement rates, and response to abstractions and uncertainty. To validate
performance, we exhibit results from applying the agent to three archetypal
planning problems, including composite hierarchical domains, and highlight
empirical findings which illustrate properties elucidated in the analysis.
- Abstract(参考訳): 本稿では,ハイパーグラフに基づく機械学習アルゴリズム,データ構造駆動型メンテナンス手法,およびDijkstraのアルゴリズムの確率的応用に基づく計画アルゴリズムを提案する。
これらを組み合わせて、従来の機械学習と従来の人工知能の両方の利点を組み込んだ、自律学習エージェントのための目標に依存しない自動計画エンジンを形成する。
このアルゴリズムが問題空間内の最適解、数学的に有界な学習性能を判定し、学習曲線、目標達成率、抽象と不確実性に対する応答の明確な予測を時間を通して解析する数学的モデルを提供する。
性能を検証するために,複合階層型ドメインを含む3つの古型計画問題に対してエージェントを適用し,分析で明らかな特性を示す経験的知見を強調する。
関連論文リスト
- AI-Aided Kalman Filters [65.35350122917914]
カルマンフィルタ(KF)とその変種は、信号処理において最も著名なアルゴリズムの一つである。
最近の進歩は、古典的なカルマン型フィルタリングでディープニューラルネットワーク(DNN)を融合させる可能性を示している。
本稿では,KF型アルゴリズムにAIを組み込むための設計アプローチについて,チュートリアル形式で概説する。
論文 参考訳(メタデータ) (2024-10-16T06:47:53Z) - On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.75164588939185]
複数モーダルな)自己教師付き表現学習のための連続領域における識別確率モデル問題について検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
論文 参考訳(メタデータ) (2024-10-11T18:02:46Z) - On the Markov Property of Neural Algorithmic Reasoning: Analyses and
Methods [94.72563337153268]
ForgetNetは歴史的埋め込みを使わないので、タスクのマルコフの性質と一致している。
また、G-ForgetNetを導入し、G-ForgetNetは歴史的埋め込みの選択的統合を可能にするゲーティング機構を使用している。
我々の実験はCLRS-30アルゴリズム推論ベンチマークに基づいて、ForgetNetとG-ForgetNetの両方が既存の手法よりも優れた一般化を実現することを示した。
論文 参考訳(メタデータ) (2024-03-07T22:35:22Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - Using Knowledge Graphs for Performance Prediction of Modular
Optimization Algorithms [4.060078409841919]
我々は知識グラフ埋め込み手法を用いて性能予測モデルを構築した。
与えられたアルゴリズムのインスタンスが特定の目標精度を達成できるかどうかを正確に予測できる3つの分類手法を示す。
論文 参考訳(メタデータ) (2023-01-24T09:28:57Z) - Latent Properties of Lifelong Learning Systems [59.50307752165016]
本稿では,生涯学習アルゴリズムの潜伏特性を推定するために,アルゴリズムに依存しないサロゲート・モデリング手法を提案する。
合成データを用いた実験により,これらの特性を推定するためのアプローチを検証する。
論文 参考訳(メタデータ) (2022-07-28T20:58:13Z) - Learning Time-Varying Graphs from Online Data [39.21234914444073]
本研究では,オンラインデータから時間変化グラフを学習するアルゴリズムフレームワークを提案する。
モデルに依存しない、すなわち抽象的な定式化において理論的に解析することができる。
フレームワークを3つのよく知られたグラフ学習モデル、すなわちガウス図形モデル(GGM)、構造方程式モデル(SEM)、滑らか性に基づくモデル(SBM)に特化する。
論文 参考訳(メタデータ) (2021-10-21T09:46:44Z) - Compositional Reinforcement Learning from Logical Specifications [21.193231846438895]
最近のアプローチでは、与えられた仕様から報酬関数を自動的に生成し、適切な強化学習アルゴリズムを用いてポリシーを学習する。
我々は、高レベルの計画と強化学習をインターリーブする、DiRLと呼ばれる構成学習手法を開発した。
提案手法では,各エッジ(サブタスク)のニューラルネットワークポリシをDijkstraスタイルの計画アルゴリズムで学習し,グラフの高レベルプランを計算する。
論文 参考訳(メタデータ) (2021-06-25T22:54:28Z) - Structured Prediction for CRiSP Inverse Kinematics Learning with
Misspecified Robot Models [39.513301957826435]
本稿では,データ駆動戦略とフォワードキネマティックス関数を組み合わせた構造化予測アルゴリズムを提案する。
提案手法により、予測された関節構成がロボットの制約内に適切に収まることが保証される。
論文 参考訳(メタデータ) (2021-02-25T15:39:33Z) - Learning to plan with uncertain topological maps [14.774543742438176]
我々は,グラフベースのプランナとローカルポリシーを含む階層的戦略を用いて,エージェントに3D環境をナビゲートするように訓練する。
実写3D環境における本手法の実証解析により,学習したニューラルプランナーに視覚的特徴を組み込むことで,グラフベース計画における古典的記号解よりも優れることを示した。
論文 参考訳(メタデータ) (2020-07-10T09:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。