論文の概要: Hierarchical Reinforcement Learning for Deep Goal Reasoning: An
Expressiveness Analysis
- arxiv url: http://arxiv.org/abs/2006.11704v1
- Date: Sun, 21 Jun 2020 03:29:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 12:15:52.330408
- Title: Hierarchical Reinforcement Learning for Deep Goal Reasoning: An
Expressiveness Analysis
- Title(参考訳): 深いゴール推論のための階層的強化学習:表現性分析
- Authors: Weihang Yuan, H\'ector Mu\~noz-Avila
- Abstract要約: 我々は、h-DQNで解決できないタスクを示し、この種の階層的フレームワーク(HF)の限界を実証する。
本稿では、リカレントニューラルネットワークをメタレベルで利用するアーキテクチャを一般化した、リカレント階層フレームワーク(RHF)について述べる。
- 参考スコア(独自算出の注目度): 0.5076419064097732
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical DQN (h-DQN) is a two-level architecture of feedforward neural
networks where the meta level selects goals and the lower level takes actions
to achieve the goals. We show tasks that cannot be solved by h-DQN,
exemplifying the limitation of this type of hierarchical framework (HF). We
describe the recurrent hierarchical framework (RHF), generalizing architectures
that use a recurrent neural network at the meta level. We analyze the
expressiveness of HF and RHF using context-sensitive grammars. We show that RHF
is more expressive than HF. We perform experiments comparing an implementation
of RHF with two HF baselines; the results corroborate our theoretical findings.
- Abstract(参考訳): 階層型DQN(h-DQN)は、フィードフォワードニューラルネットワークの2レベルアーキテクチャであり、メタレベルが目標を選択し、下位レベルが目標を達成するためにアクションを取る。
我々は、h-DQNで解決できないタスクを示し、このタイプの階層的フレームワーク(HF)の限界を実証する。
本稿では,リカレントニューラルネットワークを用いたアーキテクチャを一般化したrhf(recurrent hierarchical framework)について述べる。
文脈感性文法を用いてHFとRHFの表現性を解析する。
RHFはHFよりも表現力が高いことを示す。
rhfの実装と2つのhfベースラインを比較して実験を行い,理論的な結果と一致した。
関連論文リスト
- Discovering Message Passing Hierarchies for Mesh-Based Physics Simulation [61.89682310797067]
DHMPを導入し,異なるノード選択手法を用いてメッセージパッシングネットワークの動的階層を学習する。
本実験はDHMPの有効性を実証し,近年の固定階層型メッセージパッシングネットワークと比較して平均22.7%改善した。
論文 参考訳(メタデータ) (2024-10-03T15:18:00Z) - Informed deep hierarchical classification: a non-standard analysis inspired approach [0.0]
出力層の前に配置された特定のプロジェクション演算子を備えた多出力ディープニューラルネットワークで構成されている。
このようなアーキテクチャの設計は、LH-DNN(Lexicographic Hybrid Deep Neural Network)と呼ばれ、異なる研究分野と非常に離れた研究分野のツールを組み合わせることで実現されている。
アプローチの有効性を評価するために、階層的な分類タスクに適した畳み込みニューラルネットワークであるB-CNNと比較する。
論文 参考訳(メタデータ) (2024-09-25T14:12:50Z) - TOPIQ: A Top-down Approach from Semantics to Distortions for Image
Quality Assessment [53.72721476803585]
画像品質評価(IQA)は、ディープニューラルネットワークによる顕著な進歩を目の当たりにしたコンピュータビジョンの基本課題である。
本稿では,高レベルの意味論を用いてIQAネットワークを誘導し,意味的に重要な局所歪み領域に注目するトップダウンアプローチを提案する。
提案手法の重要な要素は,低レベル特徴に対するアテンションマップを算出した,クロススケールアテンション機構である。
論文 参考訳(メタデータ) (2023-08-06T09:08:37Z) - Improving Grammar-based Sequence-to-Sequence Modeling with Decomposition
and Constraints [30.219318352970948]
より高速な推論のための2つの低ランクなニューラルネットワークQCFGについて検討する。
木階層とソースカバレッジに対する2つのソフト制約を導入します。
我々のモデルは、ほとんどの設定でバニラニューラルQCFGよりも優れています。
論文 参考訳(メタデータ) (2023-06-05T08:05:05Z) - The generalized Hierarchical Gaussian Filter [0.22436328017044366]
認知神経科学において、認知と学習の生成モデルは、精神障害の概念を伝えるために用いられる。
我々は、HGFの基盤となる生成モデルの空間を、状態値間の非線形階層的結合の形式を含むように拡張する。
我々の開発は、経験的データ分析のための階層ベイズモデルの高度に柔軟な実装を可能にし、オープンソースソフトウェアとして利用可能です。
論文 参考訳(メタデータ) (2023-05-18T12:55:31Z) - RDRN: Recursively Defined Residual Network for Image Super-Resolution [58.64907136562178]
深部畳み込みニューラルネットワーク(CNN)は、単一画像超解像において顕著な性能を得た。
本稿では,注目ブロックを効率的に活用する新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-17T11:06:29Z) - Rank Diminishing in Deep Neural Networks [71.03777954670323]
ニューラルネットワークのランクは、層をまたがる情報を測定する。
これは機械学習の幅広い領域にまたがる重要な構造条件の例である。
しかし、ニューラルネットワークでは、低ランク構造を生み出す固有のメカニズムはあいまいで不明瞭である。
論文 参考訳(メタデータ) (2022-06-13T12:03:32Z) - An Analysis of Complex-Valued CNNs for RF Data-Driven Wireless Device
Classification [12.810432378755904]
最近のディープニューラルネットワークに基づくデバイス分類研究は、複素数値ニューラルネットワーク(CVNN)が実数値ニューラルネットワーク(RVNN)よりも高い分類精度が得られることを示している。
本研究は、実際のLoRaおよびWiFi RFデータセットを用いて、この傾向についてより深く理解する。
論文 参考訳(メタデータ) (2022-02-20T10:35:20Z) - Walking Out of the Weisfeiler Leman Hierarchy: Graph Learning Beyond
Message Passing [4.272016212825404]
グラフ学習のためのニューラルネットワークアーキテクチャであるCRaWlを提案する。
CRaWlはメッセージパッシンググラフニューラルネットワークとは根本的に異なる。
CRaWlの表現性はWeisfeiler Lemanアルゴリズムと相容れないことを示す。
論文 参考訳(メタデータ) (2021-02-17T14:28:41Z) - Hierarchical Neural Architecture Search for Deep Stereo Matching [131.94481111956853]
本稿では, ディープステレオマッチングのための最初のエンドツーエンド階層型NASフレームワークを提案する。
我々のフレームワークは、タスク固有の人間の知識をニューラルアーキテクチャ検索フレームワークに組み込んでいる。
KITTI stereo 2012、2015、Middleburyベンチマークで1位、SceneFlowデータセットで1位にランクインしている。
論文 参考訳(メタデータ) (2020-10-26T11:57:37Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。