論文の概要: Reinforcement Learning with Knowledge Representation and Reasoning: A
Brief Survey
- arxiv url: http://arxiv.org/abs/2304.12090v1
- Date: Mon, 24 Apr 2023 13:35:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 14:54:45.882326
- Title: Reinforcement Learning with Knowledge Representation and Reasoning: A
Brief Survey
- Title(参考訳): 知識表現と推論による強化学習 : 簡単な調査
- Authors: Chao Yu, Xuejing Zheng, Hankz Hankui Zhuo, Hai Wan, Weilin Luo
- Abstract要約: 近年,強化学習は飛躍的な発展を遂げている。
いまだに複雑な実生活問題に対処する上で大きな障害に直面している。
近年,知識表現と推論の利用に対する関心が高まっている。
- 参考スコア(独自算出の注目度): 24.81327556378729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement Learning(RL) has achieved tremendous development in recent
years, but still faces significant obstacles in addressing complex real-life
problems due to the issues of poor system generalization, low sample efficiency
as well as safety and interpretability concerns. The core reason underlying
such dilemmas can be attributed to the fact that most of the work has focused
on the computational aspect of value functions or policies using a
representational model to describe atomic components of rewards, states and
actions etc, thus neglecting the rich high-level declarative domain knowledge
of facts, relations and rules that can be either provided a priori or acquired
through reasoning over time. Recently, there has been a rapidly growing
interest in the use of Knowledge Representation and Reasoning(KRR) methods,
usually using logical languages, to enable more abstract representation and
efficient learning in RL. In this survey, we provide a preliminary overview on
these endeavors that leverage the strengths of KRR to help solving various
problems in RL, and discuss the challenging open problems and possible
directions for future work in this area.
- Abstract(参考訳): 強化学習(RL)は近年,システム一般化の貧弱さ,サンプル効率の低さ,安全性や解釈可能性の問題など,複雑な現実問題に対処する上で大きな障害に直面している。
このようなジレンマの根底にある主な理由は、ほとんどの作業が、報酬、状態、行動などの原子成分を記述する表現モデルを用いて、価値関数やポリシーの計算的な側面に焦点を合わせており、その結果、より高度な宣言的ドメインの知識を無視しているという事実である。
近年,論理言語を用いた知識表現と推論(KRR)手法の利用への関心が急速に高まり,より抽象的な表現とRLの効率的な学習が可能になった。
本稿では,krrの強みを活かしてrlの様々な問題を解決するための取り組みについて予備的な概要を述べるとともに,この分野における今後の課題と今後の課題の方向性について考察する。
関連論文リスト
- Puzzle Solving using Reasoning of Large Language Models: A Survey [2.1392064955842023]
本稿では,Large Language Models (LLMs) のパズル解法における能力について検討する。
以上の結果から,LLM能力と人為的推論の相違が明らかとなった。
この調査は、LLMのパズル解決能力を向上させるために、新しい戦略とよりリッチなデータセットの必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-17T14:19:38Z) - Learning by Doing: An Online Causal Reinforcement Learning Framework
with Causal-Aware Policy [40.33036146207819]
我々は、図形因果モデルを用いて、状態の生成過程を明示的にモデル化することを検討する。
我々は、環境のアクティブな介入学習とRL相互作用プロセスに更新する因果構造を定式化する。
論文 参考訳(メタデータ) (2024-02-07T14:09:34Z) - Knowledge Crosswords: Geometric Reasoning over Structured Knowledge with
Large Language Models [51.35398315130094]
構造的知識に対する幾何学的推論を提案し、そこでは知識の一部がグラフ構造に連結され、モデルは不足した情報を埋める必要がある。
このような幾何学的知識推論は、構造化された知識、不確実性のある推論、事実の検証、エラーが発生した時のバックトラックを扱う能力を必要とする。
本稿では,不完全なエンティティネットワークの幾何学的制約を表す自然言語質問からなるマルチブランクQAデータセットであるKnowledge Crosswordsを提案する。
論文 参考訳(メタデータ) (2023-10-02T15:43:53Z) - Causal Reinforcement Learning: A Survey [57.368108154871]
強化学習は、不確実性の下でのシーケンシャルな決定問題の解決に不可欠なパラダイムである。
主な障害の1つは、強化学習エージェントが世界に対する根本的な理解を欠いていることである。
因果性は、体系的な方法で知識を形式化できるという点で顕著な利点がある。
論文 参考訳(メタデータ) (2023-07-04T03:00:43Z) - Structure in Reinforcement Learning: A Survey and Open Problems [19.928429846847422]
関数近似のためのディープニューラルネットワーク(DNN)の表現能力に支えられた強化学習(RL)は、多くのアプリケーションでかなりの成功を収めている。
しかし、様々な現実のシナリオに対処する実践性は、多様で予測不可能なダイナミクスによって特徴づけられるが、依然として限られている。
この制限は、データ効率の低下、一般化能力の制限、安全性保証の欠如、解釈可能性の欠如などの問題に起因している。
論文 参考訳(メタデータ) (2023-06-28T08:48:40Z) - A Comprehensive Survey of Continual Learning: Theory, Method and
Application [64.23253420555989]
本稿では,基礎的設定,理論的基礎,代表的方法,実践的応用を橋渡しする継続的学習に関する包括的調査を行う。
連続学習の一般的な目的は、資源効率の文脈において、適切な安定性と塑性のトレードオフと適切なタスク内/タスク内一般化性を保証することであると要約する。
論文 参考訳(メタデータ) (2023-01-31T11:34:56Z) - Explainable Deep Reinforcement Learning: State of the Art and Challenges [1.005130974691351]
解釈可能性、説明可能性、透明性は、多くの重要な領域で人工知能メソッドを導入する上で重要な問題である。
本稿では, 深層強化学習法について解説する技術の現状について概説する。
論文 参考訳(メタデータ) (2023-01-24T11:41:25Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Causal Inference Principles for Reasoning about Commonsense Causality [93.19149325083968]
コモンセンス因果推論(Commonsense causality reasoning)は、平均的な人によって妥当と見なされる自然言語記述における妥当な原因と影響を特定することを目的としている。
既存の作業は通常、深い言語モデルに全面的に依存しており、共起を混同する可能性がある。
古典的因果原理に触発され,我々はCCRの中心的問題を明確にし,観察研究と自然言語における人間の対象間の類似性を引き出す。
本稿では,時間信号をインシデント・インシデント・インシデント・インシデント・インシデントとして活用する新しいフレームワークであるROCKをReason O(A)bout Commonsense K(C)ausalityに提案する。
論文 参考訳(メタデータ) (2022-01-31T06:12:39Z) - Scientia Potentia Est -- On the Role of Knowledge in Computational
Argumentation [52.903665881174845]
本稿では,計算議論に必要な知識のピラミッドを提案する。
この分野におけるこれらのタイプの役割と統合について,その技術の現状を簡潔に論じる。
論文 参考訳(メタデータ) (2021-07-01T08:12:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。