Fugu-MT 論文翻訳(概要): Learning Generalized Relational Heuristic Networks for Model-Agnostic Planning

論文の概要: Learning Generalized Relational Heuristic Networks for Model-Agnostic Planning

arxiv url: http://arxiv.org/abs/2007.06702v2
Date: Tue, 20 Oct 2020 03:04:41 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-11 21:07:35.273126
Title: Learning Generalized Relational Heuristic Networks for Model-Agnostic Planning
Title（参考訳）: モデル非依存計画のための一般リレーショナルヒューリスティックネットワークの学習
Authors: Rushang Karia, Siddharth Srivastava
Abstract要約: 本稿では,記号的行動モデルが存在しない場合の一般化を学習するための新しいアプローチを開発する。データの効率的で一般化可能な学習を容易にするために、抽象状態表現を使用する。
参考スコア（独自算出の注目度）: 29.714818991696088
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Computing goal-directed behavior is essential to designing efficient AI systems. Due to the computational complexity of planning, current approaches rely primarily upon hand-coded symbolic action models and hand-coded heuristic-function generators for efficiency. Learned heuristics for such problems have been of limited utility as they are difficult to apply to problems with objects and object quantities that are significantly different from those in the training data. This paper develops a new approach for learning generalized heuristics in the absence of symbolic action models using deep neural networks that utilize an input predicate vocabulary but are agnostic to object names and quantities. It uses an abstract state representation to facilitate data efficient, generalizable learning. Empirical evaluation on a range of benchmark domains show that in contrast to prior approaches, generalized heuristics computed by this method can be transferred easily to problems with different objects and with object quantities much larger than those in the training data.
Abstract（参考訳）: 効率的なAIシステムの設計には、目標指向の行動の計算が不可欠である。計画の計算の複雑さから、現在のアプローチは、主に手書きのシンボリックアクションモデルと、効率のために手書きのヒューリスティックファンクションジェネレータに依存している。このような問題に対する学習的ヒューリスティックスは、トレーニングデータと大きく異なるオブジェクトやオブジェクトの量に関する問題に適用することが難しいため、限られたユーティリティである。本稿では,入力述語語彙を活用しつつ,対象名や量に依存しない深層ニューラルネットワークを用いて,記号的行動モデルが存在しない場合の一般化ヒューリスティックスを学ぶための新しい手法を提案する。データの効率的で一般化可能な学習を容易にするために、抽象状態表現を使用する。従来の手法とは対照的に、この手法によって計算された一般化されたヒューリスティックは、異なる対象と、トレーニングデータよりもはるかに大きいオブジェクトの量に容易に変換可能であることを示す。

関連論文リスト

Learning Task Representations from In-Context Learning [73.72066284711462]
大規模言語モデル(LLM)は、文脈内学習において顕著な習熟性を示している。 ICLプロンプトにおけるタスク情報をアテンションヘッドの関数として符号化するための自動定式化を導入する。提案手法の有効性は,最後の隠れ状態の分布と最適に実行されたテキスト内学習モデルとの整合性に起因していることを示す。
論文参考訳（メタデータ） (2025-02-08T00:16:44Z)
Efficient Representations for High-Cardinality Categorical Variables in Machine Learning [0.0]
ハイカーディナリティのカテゴリ変数は、機械学習において重大な課題を生じさせる。伝統的なワンホット符号化は、しばしば高次元のスパース特徴空間をもたらす。本稿では,平均符号化,低ランク符号化,多項ロジスティック回帰符号化など,新しい符号化手法を提案する。
論文参考訳（メタデータ） (2025-01-10T01:25:01Z)
Learning of networked spreading models from noisy and incomplete data [7.669018800404791]
スケーラブルな動的メッセージパッシング技術に基づく普遍的な学習手法を提案する。このアルゴリズムは、モデルとデータに関する利用可能な事前知識を活用し、拡散モデルのネットワーク構造とパラメータの両方を再構成する。キーモデルパラメータを持つ手法の線形計算複雑性は,アルゴリズムを大規模ネットワークインスタンスにスケーラブルにすることを示す。
論文参考訳（メタデータ） (2023-12-20T13:12:47Z)
Representation Learning with Multi-Step Inverse Kinematics: An Efficient and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文参考訳（メタデータ） (2023-04-12T14:51:47Z)
Invariant Causal Mechanisms through Distribution Matching [86.07327840293894]
本研究では、因果的視点と不変表現を学習するための新しいアルゴリズムを提供する。実験により,このアルゴリズムは様々なタスク群でうまく動作し,特にドメインの一般化における最先端のパフォーマンスを観察する。
論文参考訳（メタデータ） (2022-06-23T12:06:54Z)
HyperImpute: Generalized Iterative Imputation with Automatic Model Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文参考訳（メタデータ） (2022-06-15T19:10:35Z)
Generalization of Neural Combinatorial Solvers Through the Lens of Adversarial Robustness [68.97830259849086]
ほとんどのデータセットは単純なサブプロブレムのみをキャプチャし、おそらくは突発的な特徴に悩まされる。本研究では, 局所的な一般化特性である対向ロバスト性について検討し, 厳密でモデル固有な例と突発的な特徴を明らかにする。他のアプリケーションとは異なり、摂動モデルは知覚できないという主観的な概念に基づいて設計されているため、摂動モデルは効率的かつ健全である。驚くべきことに、そのような摂動によって、十分に表現力のあるニューラルソルバは、教師あり学習で共通する正確さと悪質さのトレードオフの限界に悩まされない。
論文参考訳（メタデータ） (2021-10-21T07:28:11Z)
Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文参考訳（メタデータ） (2021-06-17T17:26:31Z)
Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文参考訳（メタデータ） (2020-12-15T16:29:49Z)
Active Importance Sampling for Variational Objectives Dominated by Rare Events: Consequences for Optimization and Generalization [12.617078020344618]
本稿では,レアイベントサンプリング手法とニューラルネットワーク最適化を組み合わせて,レアイベントに支配される目的関数を最適化する手法を提案する。重要度サンプリングは学習問題に対する解の分散を減少させ,一般化の利点を示唆することを示す。数値実験により,高次元データと希少データの複合化が困難である場合でも,学習を成功させることができた。
論文参考訳（メタデータ） (2020-08-11T23:38:09Z)
Machine Learning to Tackle the Challenges of Transient and Soft Errors in Complex Circuits [0.16311150636417257]
機械学習モデルは、回路インスタンスの完全なリストに対して、インスタンスごとの正確な関数デレートデータを予測するために使用される。提案手法を実例に適用し,各種機械学習モデルの評価と比較を行った。
論文参考訳（メタデータ） (2020-02-18T18:38:54Z)
On the Estimation of Complex Circuits Functional Failure Rate by Machine Learning Techniques [0.16311150636417257]
デレーティング(De-Rating)あるいは脆弱性要因(Vulnerability Factors)は、今日の機能的安全要件によって管理される障害分析の最大の特徴である。機械学習を用いて個々のフリップフロップの関数的デレートを推定する新しい手法が提案されている。
論文参考訳（メタデータ） (2020-02-18T15:18:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。