論文の概要: Learning Relational Rules from Rewards
- arxiv url: http://arxiv.org/abs/2203.13599v1
- Date: Fri, 25 Mar 2022 11:57:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-28 19:20:14.807321
- Title: Learning Relational Rules from Rewards
- Title(参考訳): 報酬から関係ルールを学ぶ
- Authors: Guillermo Puebla, Leonidas A. A. Doumas
- Abstract要約: リレーショナル・リレーショナル・リレーショナル・ラーニング(RRL)で開発された関数近似器に基づくリレーショナル・ポリシー・ラーニングの簡易モデルを構築した。
私たちはAtariの3つのゲームで、Breakout、Pong、Demon Attackといった潜在的な関係を考慮し、モデルをトレーニングし、テストしました。
各ゲームにおいて,我々のモデルは適切なリレーショナル表現を選択し,段階的にリレーショナルポリシーを構築することができた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans perceive the world in terms of objects and relations between them. In
fact, for any given pair of objects, there is a myriad of relations that apply
to them. How does the cognitive system learn which relations are useful to
characterize the task at hand? And how can it use these representations to
build a relational policy to interact effectively with the environment? In this
paper we proposed that this problem can be understood through the lens of a
sub-field of symbolic machine learning called relational reinforcement learning
(RRL). To demonstrate the potential of our approach, we build a simple model of
relational policy learning based on a function approximator developed in RRL.
We trained and tested our model in three Atari games that required to consider
an increasingly number of potential relations: Breakout, Pong and Demon Attack.
In each game, our model was able to select adequate relational representations
and build a relational policy incrementally. We discuss the relationship
between our model with models of relational and analogical reasoning, as well
as its limitations and future directions of research.
- Abstract(参考訳): 人間はオブジェクトとそれらの関係の観点から世界を認識する。
実際、任意の対のオブジェクトには、それらに適用される無数の関係があります。
認知システムは、手作業の特徴付けに有用な関係をどのように学習するか?
そして、どのようにしてこれらの表現を使用して環境と効果的に相互作用するリレーショナルポリシーを構築することができるのか?
本稿では,関係強化学習(relational reinforcement learning, rrl)と呼ばれるシンボリック機械学習のサブフィールドのレンズを通して,この問題を理解することを提案する。
提案手法の可能性を実証するため,RRLで開発された関数近似器に基づいて,関係ポリシー学習の簡易モデルを構築した。
私たちはAtariの3つのゲームで、Breakout、Pong、Demon Attackといった潜在的な関係を考慮し、モデルをトレーニングし、テストしました。
各ゲームでは,適切なリレーショナル表現を選択し,インクリメンタルにリレーショナルポリシを構築することができた。
本稿では,関係モデルと類似推論モデルとの関係と,その限界と今後の研究の方向性について考察する。
関連論文リスト
- Learning Complete Topology-Aware Correlations Between Relations for Inductive Link Prediction [121.65152276851619]
関係性間の意味的相関は本質的にエッジレベルとエンティティ非依存であることを示す。
本研究では,関係関係のトポロジ・アウェア・コレレーションをモデル化するための新しいサブグラフベース手法,TACOを提案する。
RCNのポテンシャルをさらに活用するために, 完全コモンニアインダストリアルサブグラフを提案する。
論文 参考訳(メタデータ) (2023-09-20T08:11:58Z) - On Neural Architecture Inductive Biases for Relational Tasks [76.18938462270503]
合成ネットワーク一般化(CoRelNet)と呼ばれる類似度分布スコアに基づく簡単なアーキテクチャを導入する。
単純なアーキテクチャの選択は、分布外一般化において既存のモデルより優れていることが分かる。
論文 参考訳(メタデータ) (2022-06-09T16:24:01Z) - Learning to Compose Visual Relations [100.45138490076866]
我々は,各関係を非正規化密度(エネルギーベースモデル)として表現することを提案する。
このような分解を分解することで、複数の関係を持つシーンをより忠実に生成・編集できることを示す。
論文 参考訳(メタデータ) (2021-11-17T18:51:29Z) - Open Relation Modeling: Learning to Define Relations between Entities [24.04238065663009]
本稿では,機械にエンティティの定義から学習させることで,定義のような関係記述を生成することを提案する。
具体的には、抽出されたエンティティペアに条件付き定義を生成するために、PLM(Pre-Tuneed Language Models)を微調整する。
我々は, PLM が信頼度推定によって解釈可能かつ情報的推論経路を選択できることを示し, 選択した経路が PLM を誘導し, より優れた関係記述を生成することを示す。
論文 参考訳(メタデータ) (2021-08-20T16:03:23Z) - pix2rule: End-to-end Neuro-symbolic Rule Learning [84.76439511271711]
本稿では,画像のオブジェクトへの処理,学習関係,論理規則に関する完全なニューロシンボリックな手法を提案する。
主な貢献は、シンボリックリレーションとルールを抽出できるディープラーニングアーキテクチャにおける差別化可能なレイヤである。
我々のモデルは最先端のシンボリックラーナーを超えてスケールし、ディープリレーショナルニューラルネットワークアーキテクチャよりも優れていることを実証する。
論文 参考訳(メタデータ) (2021-06-14T15:19:06Z) - ZS-BERT: Towards Zero-Shot Relation Extraction with Attribute
Representation Learning [10.609715843964263]
目に見える関係と見えない関係のテキスト記述を組み込んでゼロショット関係抽出問題を定式化する。
本稿では,手作りラベリングや複数対属性分類を使わずに,目に見えない関係を直接予測する,新しいマルチタスク学習モデルであるゼロショットBERTを提案する。
2つのよく知られたデータセットで行われた実験では、ZS-BERTが少なくとも13.54%のF1スコアの改善によって既存の方法より優れていることが示されています。
論文 参考訳(メタデータ) (2021-04-10T06:53:41Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - Learning Relation Ties with a Force-Directed Graph in Distant Supervised
Relation Extraction [39.73191604776768]
関係関係は、異なる関係間の相関関係と相互排除として定義されるが、遠方の教師付き関係抽出には重要である。
既存のアプローチは、局所的な依存関係を丁寧に学習することで、この特性をモデル化する。
本稿では,関係関係を包括的に学習する,力によるグラフに基づく関係抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-04-21T14:41:38Z) - Learning Object Placements For Relational Instructions by Hallucinating
Scene Representations [26.897316325189205]
単一入力画像から空間関係の集合に対する画素単位の物体配置確率を推定するための畳み込みニューラルネットワークを提案する。
本手法では,オブジェクトの画素関係確率や3次元モデルに対して,地上の真理データを必要としない。
実世界のデータと人間ロボット実験を用いて,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-01-23T12:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。