論文の概要: Combining Evolution and Deep Reinforcement Learning for Policy Search: a
Survey
- arxiv url: http://arxiv.org/abs/2203.14009v1
- Date: Sat, 26 Mar 2022 07:15:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 16:05:07.722221
- Title: Combining Evolution and Deep Reinforcement Learning for Policy Search: a
Survey
- Title(参考訳): 政策探索のための進化と深層強化学習の併用に関する調査
- Authors: Olivier Sigaud
- Abstract要約: 深層神経進化と深層強化学習は、ここ数年で多くの注目を集めています。
新興のトレンドは、両方の世界のベストから恩恵を受けるためにそれらを組み合わせることにあります。
文献を関連する作業グループに整理し、各グループに既存の組み合わせをすべて汎用的なフレームワークにキャストすることで、この新興トレンドを調査する。
- 参考スコア(独自算出の注目度): 8.626451214149716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neuroevolution and deep Reinforcement Learning have received a lot of
attention in the last years. Some works have compared them, highlighting theirs
pros and cons, but an emerging trend consists in combining them so as to
benefit from the best of both worlds. In this paper, we provide a survey of
this emerging trend by organizing the literature into related groups of works
and casting all the existing combinations in each group into a generic
framework. We systematically cover all easily available papers irrespective of
their publication status, focusing on the combination mechanisms rather than on
the experimental results. In total, we cover 43 algorithms more recent than
2017. We hope this effort will favor the growth of the domain by facilitating
the understanding of the relationships between the methods, favoring deeper
analyses, outlining missing useful comparisons and suggesting new combinations
of mechanisms.
- Abstract(参考訳): 深層神経進化と深層強化学習はここ数年、多くの注目を集めてきた。
それらを比較して、彼らの長所と短所を強調している作品もあるが、新しいトレンドは両世界の長所から恩恵を受けるためにそれらを組み合わせることにある。
本稿では,文献を関連する作業グループに整理し,各グループに既存の組み合わせをすべて汎用的なフレームワークにキャストすることで,この新興傾向を調査する。
実験結果よりも組み合わせ機構に着目し,出版状況によらず,利用可能な論文をすべて体系的に網羅する。
合計で、2017年より最近43のアルゴリズムをカバーしている。
この取り組みが、メソッド間の関係の理解を促進し、より深い分析を優先し、有用な比較の欠如を概説し、新しいメカニズムの組み合わせを提案することで、ドメインの成長を促進することを期待しています。
関連論文リスト
- Towards a Systematic Approach to Design New Ensemble Learning Algorithms [0.0]
本研究は,アンサンブルの誤り分解に関する基礎研究を再考する。
最近の進歩は「多様性の統一理論」を導入した
本研究は,新たなアンサンブル学習アルゴリズムの創出を導くために,この分解の応用を体系的に検討する。
論文 参考訳(メタデータ) (2024-02-09T22:59:20Z) - Towards Distribution-Agnostic Generalized Category Discovery [51.52673017664908]
データ不均衡とオープンエンドの分布は、現実の視覚世界の本質的な特性である。
我々は,BaCon(Self-Balanced Co-Advice contrastive framework)を提案する。
BaConは、対照的な学習ブランチと擬似ラベルブランチで構成され、DA-GCDタスクを解決するためのインタラクティブな監視を提供するために協力して動作する。
論文 参考訳(メタデータ) (2023-10-02T17:39:58Z) - Generalization Bounds: Perspectives from Information Theory and
PAC-Bayes [30.6461568538686]
PAC-Bayesianアプローチは、機械学習アルゴリズムの一般化機能に対処するための柔軟なフレームワークとして確立されている。
一般化に関する情報理論的な視点が発達し、一般化と様々な情報手段の関係が確立された。
本稿では,2つの視点が共通する手法と結果を提示し,異なるアプローチと解釈について議論する。
論文 参考訳(メタデータ) (2023-09-08T15:23:40Z) - Retrieval Augmentation for Commonsense Reasoning: A Unified Approach [64.63071051375289]
検索強化コモンセンス推論(RACo)の統一的枠組みを提案する。
提案するRACoは,他の知識強化手法よりも優れる。
論文 参考訳(メタデータ) (2022-10-23T23:49:08Z) - Oracles & Followers: Stackelberg Equilibria in Deep Multi-Agent
Reinforcement Learning [24.284863599920115]
マルチエージェントRL問題としてStackelberg equilibria Searchを実装するための一般的なフレームワークを提案する。
我々は、このフレームワークの特定のインスタンス化として、これまでのアプローチがどのように捉えられるかについて議論する。
論文 参考訳(メタデータ) (2022-10-19T23:04:16Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - Forecast combinations: an over 50-year review [16.590353808305245]
予報の組み合わせは予報コミュニティで著しく繁栄している。
本稿では,予測組み合わせに関する文献を概観する。
様々な手法の可能性と限界について議論し、これらのアイデアが時間とともにどのように発展してきたかを明らかにする。
論文 参考訳(メタデータ) (2022-05-09T12:14:02Z) - Structurally Diverse Sampling Reduces Spurious Correlations in Semantic
Parsing Datasets [51.095144091781734]
本稿では,構造化された出力を持つラベル付きインスタンスプールから,構造的に多様なインスタンス群をサンプリングする新しいアルゴリズムを提案する。
提案アルゴリズムは, 合成テンプレート分割だけでなく, 従来のID分割においても, 従来のアルゴリズムよりも競合的に動作することを示す。
一般に、多種多様な列車集合は、10組のデータセット分割ペアのうち9組で同じ大きさのランダムな訓練集合よりも優れた一般化をもたらす。
論文 参考訳(メタデータ) (2022-03-16T07:41:27Z) - A Survey of Evolutionary Multi-Objective Clustering Approaches [0.0]
進化的多目的クラスタリングの一般的なアーキテクチャで提案される特徴と構成要素に基づいてアルゴリズムを解析する。
新しいアプローチを設計したり、既存のものを選択したり使用する際には、特定のクラスタリングプロパティ以外にこれらの側面を観察することが不可欠です。
論文 参考訳(メタデータ) (2021-10-15T13:53:12Z) - End-to-End Constrained Optimization Learning: A Survey [69.22203885491534]
機械学習アーキテクチャとソルバと最適化手法を統合する作業の調査に焦点を当てている。
これらのアプローチは、問題に対する迅速、近似、構造的、解決策を予測し、論理的推論を可能にする新しいハイブリッド機械学習と最適化手法を開発することを約束します。
論文 参考訳(メタデータ) (2021-03-30T14:19:30Z) - UnitedQA: A Hybrid Approach for Open Domain Question Answering [70.54286377610953]
最近の訓練済みのニューラル言語モデルに基づいて,抽出的および生成的読取能力を高めるために,新しい手法を適用した。
私たちのアプローチは、それぞれNaturalQuestionsとTriviaQAと正確な一致で、以前の最先端のモデルを3.3と2.7ポイント上回る。
論文 参考訳(メタデータ) (2021-01-01T06:36:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。