論文の概要: GALOIS: Boosting Deep Reinforcement Learning via Generalizable Logic
Synthesis
- arxiv url: http://arxiv.org/abs/2205.13728v1
- Date: Fri, 27 May 2022 02:50:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 13:58:55.233139
- Title: GALOIS: Boosting Deep Reinforcement Learning via Generalizable Logic
Synthesis
- Title(参考訳): GALOIS:汎用論理合成による深層強化学習の促進
- Authors: Yushi Cao, Zhiming Li, Tianpei Yang, Hao Zhang, Yan Zheng, Yi Li,
Jianye Hao, Yang Liu
- Abstract要約: 深層強化学習(DRL)は複雑な問題における学習と一般化に関する高次知能を欠いている。
従来の研究は、論理駆動の振る舞いを示すDRLポリシーとして、ホワイトボックス論理プログラムを直接合成しようと試みていた。
本稿では,階層的かつ厳密な因果論理プログラムを合成するためのGALOIS(Generalizable Logic Synthesis)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 34.54658276390227
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite achieving superior performance in human-level control problems,
unlike humans, deep reinforcement learning (DRL) lacks high-order intelligence
(e.g., logic deduction and reuse), thus it behaves ineffectively than humans
regarding learning and generalization in complex problems. Previous works
attempt to directly synthesize a white-box logic program as the DRL policy,
manifesting logic-driven behaviors. However, most synthesis methods are built
on imperative or declarative programming, and each has a distinct limitation,
respectively. The former ignores the cause-effect logic during synthesis,
resulting in low generalizability across tasks. The latter is strictly
proof-based, thus failing to synthesize programs with complex hierarchical
logic. In this paper, we combine the above two paradigms together and propose a
novel Generalizable Logic Synthesis (GALOIS) framework to synthesize
hierarchical and strict cause-effect logic programs. GALOIS leverages the
program sketch and defines a new sketch-based hybrid program language for
guiding the synthesis. Based on that, GALOIS proposes a sketch-based program
synthesis method to automatically generate white-box programs with
generalizable and interpretable cause-effect logic. Extensive evaluations on
various decision-making tasks with complex logic demonstrate the superiority of
GALOIS over mainstream baselines regarding the asymptotic performance,
generalizability, and great knowledge reusability across different
environments.
- Abstract(参考訳): 人間レベルの制御問題において優れた性能を達成したにもかかわらず、深層強化学習(drl)は高次知性(例えば論理推論と再利用)を欠いているため、複雑な問題における学習と一般化に関して人間よりも効果的に振る舞う。
従来の研究は、論理駆動の振る舞いを示すDRLポリシーとして、ホワイトボックス論理プログラムを直接合成しようと試みていた。
しかし、ほとんどの合成法は命令型または宣言型プログラミングに基づいており、それぞれに異なる制限がある。
前者は合成中の因果効果論理を無視し、タスク間の一般化性が低下する。
後者は厳密な証明に基づくため、複雑な階層論理でプログラムを合成できない。
本稿では,上記の2つのパラダイムを結合し,階層的かつ厳密な因果効果論理プログラムを合成する新しい一般化論理合成(galois)フレームワークを提案する。
GALOISはプログラムスケッチを活用し、合成を導くための新しいスケッチベースのハイブリッドプログラム言語を定義する。
これに基づいてガロアは、汎用的で解釈可能な因果効果論理を持つホワイトボックスプログラムを自動的に生成するスケッチベースのプログラム合成手法を提案する。
複雑な論理を用いた様々な意思決定タスクに対する広範囲な評価は、様々な環境における漸近的性能、一般化可能性、及び優れた知識再利用性に関する主流ベースラインよりも、GALOISの優位性を示している。
関連論文リスト
- Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning [89.89857766491475]
大規模言語モデル(LLM)に基づくKG上の複雑な推論スキーマを提案する。
任意の一階論理クエリを二分木分解により拡張し、LLMの推論能力を刺激する。
広く使われているデータセットに対する実験では、LACTは高度な手法よりも大幅に改善されている(平均+5.5% MRRスコア)。
論文 参考訳(メタデータ) (2024-05-02T18:12:08Z) - LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and
Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。
ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。
これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文 参考訳(メタデータ) (2023-09-24T05:43:19Z) - When Do Program-of-Thoughts Work for Reasoning? [51.2699797837818]
本稿では,コードと推論能力の相関性を測定するために,複雑性に富んだ推論スコア(CIRS)を提案する。
具体的には、抽象構文木を用いて構造情報をエンコードし、論理的複雑性を計算する。
コードはhttps://github.com/zjunlp/EasyInstructのEasyInstructフレームワークに統合される。
論文 参考訳(メタデータ) (2023-08-29T17:22:39Z) - ExeDec: Execution Decomposition for Compositional Generalization in Neural Program Synthesis [54.18659323181771]
プログラム合成において望ましいいくつかの異なる構成一般化形式を特徴付ける。
本稿では,ExeDecを提案する。ExeDecは,実行サブゴールを予測し,各ステップでプログラム実行によって段階的に通知される問題を解くための,新しい分解ベースの戦略である。
論文 参考訳(メタデータ) (2023-07-26T01:07:52Z) - Modeling Hierarchical Reasoning Chains by Linking Discourse Units and
Key Phrases for Reading Comprehension [80.99865844249106]
本稿では,論理的推論の基盤として,対話レベルと単語レベルの両方の文脈を扱う総合グラフネットワーク(HGN)を提案する。
具体的には、ノードレベルの関係とタイプレベルの関係は、推論過程におけるブリッジと解釈できるが、階層的な相互作用機構によってモデル化される。
論文 参考訳(メタデータ) (2023-06-21T07:34:27Z) - AISYN: AI-driven Reinforcement Learning-Based Logic Synthesis Framework [0.8356765961526955]
我々は人工知能(AI)と強化学習(RL)アルゴリズムがこの問題の解決に役立つと考えている。
オープンソースのベンチマーク回路と産業用ベンチマーク回路を併用した実験により,論理合成最適化関数をAI駆動にすることで,面積,遅延,電力といった重要な指標を大幅に改善できることが判明した。
論文 参考訳(メタデータ) (2023-02-08T00:55:24Z) - A Divide-Align-Conquer Strategy for Program Synthesis [8.595181704811889]
本稿では,大規模プログラムの探索を複数の小さなプログラム合成問題に分割する例によって,構成セグメント化がプログラミングに応用可能であることを示す。
入力と出力における構成部品の構造的アライメントは、プログラム探索を導くのに使用されるペアワイズ対応に繋がる。
論文 参考訳(メタデータ) (2023-01-08T19:10:55Z) - Differentiable Inductive Logic Programming in High-Dimensional Space [6.21540494241516]
大規模述語によるインダクティブ合成へのデルタILPアプローチの拡張を提案する。
大規模述語発明は,勾配降下による誘導的合成の微分に有効であることを示す。
論文 参考訳(メタデータ) (2022-08-13T13:46:13Z) - On syntactically similar logic programs and sequential decompositions [0.0]
ルールベースの推論は、論理プログラムを通じて人工知能研究において顕著に形式化された人間の知能の重要な部分である。
複雑な物体を素体の合成として記述することは、コンピュータ科学や科学全般において一般的な戦略である。
一段階の削減によって、異なるドメインにわたるクエリに、どのように類似性を使って答えることができるかを示す。
論文 参考訳(メタデータ) (2021-09-11T15:22:17Z) - Towards Neural-Guided Program Synthesis for Linear Temporal Logic
Specifications [26.547133495699093]
ニューラルネットワークを用いてQ関数を学習し、探索を誘導し、その後正当性を検証したプログラムを構築する。
提案手法は,検索と深層学習を組み合わせることで,合成を実現するのにユニークな手法である。
論文 参考訳(メタデータ) (2019-12-31T17:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。