論文の概要: Learning Generalized Relational Heuristic Networks for Model-Agnostic
Planning
- arxiv url: http://arxiv.org/abs/2007.06702v2
- Date: Tue, 20 Oct 2020 03:04:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 21:07:35.273126
- Title: Learning Generalized Relational Heuristic Networks for Model-Agnostic
Planning
- Title(参考訳): モデル非依存計画のための一般リレーショナルヒューリスティックネットワークの学習
- Authors: Rushang Karia, Siddharth Srivastava
- Abstract要約: 本稿では,記号的行動モデルが存在しない場合の一般化を学習するための新しいアプローチを開発する。
データの効率的で一般化可能な学習を容易にするために、抽象状態表現を使用する。
- 参考スコア(独自算出の注目度): 29.714818991696088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computing goal-directed behavior is essential to designing efficient AI
systems. Due to the computational complexity of planning, current approaches
rely primarily upon hand-coded symbolic action models and hand-coded
heuristic-function generators for efficiency. Learned heuristics for such
problems have been of limited utility as they are difficult to apply to
problems with objects and object quantities that are significantly different
from those in the training data. This paper develops a new approach for
learning generalized heuristics in the absence of symbolic action models using
deep neural networks that utilize an input predicate vocabulary but are
agnostic to object names and quantities. It uses an abstract state
representation to facilitate data efficient, generalizable learning. Empirical
evaluation on a range of benchmark domains show that in contrast to prior
approaches, generalized heuristics computed by this method can be transferred
easily to problems with different objects and with object quantities much
larger than those in the training data.
- Abstract(参考訳): 効率的なAIシステムの設計には、目標指向の行動の計算が不可欠である。
計画の計算の複雑さから、現在のアプローチは、主に手書きのシンボリックアクションモデルと、効率のために手書きのヒューリスティックファンクションジェネレータに依存している。
このような問題に対する学習的ヒューリスティックスは、トレーニングデータと大きく異なるオブジェクトやオブジェクトの量に関する問題に適用することが難しいため、限られたユーティリティである。
本稿では,入力述語語彙を活用しつつ,対象名や量に依存しない深層ニューラルネットワークを用いて,記号的行動モデルが存在しない場合の一般化ヒューリスティックスを学ぶための新しい手法を提案する。
データの効率的で一般化可能な学習を容易にするために、抽象状態表現を使用する。
従来の手法とは対照的に、この手法によって計算された一般化されたヒューリスティックは、異なる対象と、トレーニングデータよりもはるかに大きいオブジェクトの量に容易に変換可能であることを示す。
関連論文リスト
- Learning of networked spreading models from noisy and incomplete data [7.669018800404791]
スケーラブルな動的メッセージパッシング技術に基づく普遍的な学習手法を提案する。
このアルゴリズムは、モデルとデータに関する利用可能な事前知識を活用し、拡散モデルのネットワーク構造とパラメータの両方を再構成する。
キーモデルパラメータを持つ手法の線形計算複雑性は,アルゴリズムを大規模ネットワークインスタンスにスケーラブルにすることを示す。
論文 参考訳(メタデータ) (2023-12-20T13:12:47Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Invariant Causal Mechanisms through Distribution Matching [86.07327840293894]
本研究では、因果的視点と不変表現を学習するための新しいアルゴリズムを提供する。
実験により,このアルゴリズムは様々なタスク群でうまく動作し,特にドメインの一般化における最先端のパフォーマンスを観察する。
論文 参考訳(メタデータ) (2022-06-23T12:06:54Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Generalization of Neural Combinatorial Solvers Through the Lens of
Adversarial Robustness [68.97830259849086]
ほとんどのデータセットは単純なサブプロブレムのみをキャプチャし、おそらくは突発的な特徴に悩まされる。
本研究では, 局所的な一般化特性である対向ロバスト性について検討し, 厳密でモデル固有な例と突発的な特徴を明らかにする。
他のアプリケーションとは異なり、摂動モデルは知覚できないという主観的な概念に基づいて設計されているため、摂動モデルは効率的かつ健全である。
驚くべきことに、そのような摂動によって、十分に表現力のあるニューラルソルバは、教師あり学習で共通する正確さと悪質さのトレードオフの限界に悩まされない。
論文 参考訳(メタデータ) (2021-10-21T07:28:11Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - Active Importance Sampling for Variational Objectives Dominated by Rare
Events: Consequences for Optimization and Generalization [12.617078020344618]
本稿では,レアイベントサンプリング手法とニューラルネットワーク最適化を組み合わせて,レアイベントに支配される目的関数を最適化する手法を提案する。
重要度サンプリングは学習問題に対する解の分散を減少させ,一般化の利点を示唆することを示す。
数値実験により,高次元データと希少データの複合化が困難である場合でも,学習を成功させることができた。
論文 参考訳(メタデータ) (2020-08-11T23:38:09Z) - Machine Learning to Tackle the Challenges of Transient and Soft Errors
in Complex Circuits [0.16311150636417257]
機械学習モデルは、回路インスタンスの完全なリストに対して、インスタンスごとの正確な関数デレートデータを予測するために使用される。
提案手法を実例に適用し,各種機械学習モデルの評価と比較を行った。
論文 参考訳(メタデータ) (2020-02-18T18:38:54Z) - On the Estimation of Complex Circuits Functional Failure Rate by Machine
Learning Techniques [0.16311150636417257]
デレーティング(De-Rating)あるいは脆弱性要因(Vulnerability Factors)は、今日の機能的安全要件によって管理される障害分析の最大の特徴である。
機械学習を用いて個々のフリップフロップの関数的デレートを推定する新しい手法が提案されている。
論文 参考訳(メタデータ) (2020-02-18T15:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。