論文の概要: Combining Evolution and Deep Reinforcement Learning for Policy Search: a
Survey
- arxiv url: http://arxiv.org/abs/2203.14009v1
- Date: Sat, 26 Mar 2022 07:15:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 16:05:07.722221
- Title: Combining Evolution and Deep Reinforcement Learning for Policy Search: a
Survey
- Title(参考訳): 政策探索のための進化と深層強化学習の併用に関する調査
- Authors: Olivier Sigaud
- Abstract要約: 深層神経進化と深層強化学習は、ここ数年で多くの注目を集めています。
新興のトレンドは、両方の世界のベストから恩恵を受けるためにそれらを組み合わせることにあります。
文献を関連する作業グループに整理し、各グループに既存の組み合わせをすべて汎用的なフレームワークにキャストすることで、この新興トレンドを調査する。
- 参考スコア(独自算出の注目度): 8.626451214149716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neuroevolution and deep Reinforcement Learning have received a lot of
attention in the last years. Some works have compared them, highlighting theirs
pros and cons, but an emerging trend consists in combining them so as to
benefit from the best of both worlds. In this paper, we provide a survey of
this emerging trend by organizing the literature into related groups of works
and casting all the existing combinations in each group into a generic
framework. We systematically cover all easily available papers irrespective of
their publication status, focusing on the combination mechanisms rather than on
the experimental results. In total, we cover 43 algorithms more recent than
2017. We hope this effort will favor the growth of the domain by facilitating
the understanding of the relationships between the methods, favoring deeper
analyses, outlining missing useful comparisons and suggesting new combinations
of mechanisms.
- Abstract(参考訳): 深層神経進化と深層強化学習はここ数年、多くの注目を集めてきた。
それらを比較して、彼らの長所と短所を強調している作品もあるが、新しいトレンドは両世界の長所から恩恵を受けるためにそれらを組み合わせることにある。
本稿では,文献を関連する作業グループに整理し,各グループに既存の組み合わせをすべて汎用的なフレームワークにキャストすることで,この新興傾向を調査する。
実験結果よりも組み合わせ機構に着目し,出版状況によらず,利用可能な論文をすべて体系的に網羅する。
合計で、2017年より最近43のアルゴリズムをカバーしている。
この取り組みが、メソッド間の関係の理解を促進し、より深い分析を優先し、有用な比較の欠如を概説し、新しいメカニズムの組み合わせを提案することで、ドメインの成長を促進することを期待しています。
関連論文リスト
- Towards a Unified View of Preference Learning for Large Language Models: A Survey [88.66719962576005]
大きな言語モデル(LLM)は、非常に強力な能力を示す。
成功するための重要な要因の1つは、LLMの出力を人間の好みに合わせることである。
選好学習のすべての戦略を、モデル、データ、フィードバック、アルゴリズムの4つの構成要素に分解する。
論文 参考訳(メタデータ) (2024-09-04T15:11:55Z) - Evaluating Ensemble Methods for News Recommender Systems [50.90330146667386]
本稿では,Microsoft News データセット (MIND) において,様々な最先端アルゴリズムを組み合わさって優れた結果を得るために,アンサンブル手法をどのように利用できるかを示す。
その結果,NRSアルゴリズムの組み合わせは,基礎学習者が十分に多様であることから,個々のアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-06-23T13:40:50Z) - Towards a Systematic Approach to Design New Ensemble Learning Algorithms [0.0]
本研究は,アンサンブルの誤り分解に関する基礎研究を再考する。
最近の進歩は「多様性の統一理論」を導入した
本研究は,新たなアンサンブル学習アルゴリズムの創出を導くために,この分解の応用を体系的に検討する。
論文 参考訳(メタデータ) (2024-02-09T22:59:20Z) - Retrieval Augmentation for Commonsense Reasoning: A Unified Approach [64.63071051375289]
検索強化コモンセンス推論(RACo)の統一的枠組みを提案する。
提案するRACoは,他の知識強化手法よりも優れる。
論文 参考訳(メタデータ) (2022-10-23T23:49:08Z) - Oracles & Followers: Stackelberg Equilibria in Deep Multi-Agent
Reinforcement Learning [24.284863599920115]
マルチエージェントRL問題としてStackelberg equilibria Searchを実装するための一般的なフレームワークを提案する。
我々は、このフレームワークの特定のインスタンス化として、これまでのアプローチがどのように捉えられるかについて議論する。
論文 参考訳(メタデータ) (2022-10-19T23:04:16Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - Forecast combinations: an over 50-year review [16.590353808305245]
予報の組み合わせは予報コミュニティで著しく繁栄している。
本稿では,予測組み合わせに関する文献を概観する。
様々な手法の可能性と限界について議論し、これらのアイデアが時間とともにどのように発展してきたかを明らかにする。
論文 参考訳(メタデータ) (2022-05-09T12:14:02Z) - A Survey of Evolutionary Multi-Objective Clustering Approaches [0.0]
進化的多目的クラスタリングの一般的なアーキテクチャで提案される特徴と構成要素に基づいてアルゴリズムを解析する。
新しいアプローチを設計したり、既存のものを選択したり使用する際には、特定のクラスタリングプロパティ以外にこれらの側面を観察することが不可欠です。
論文 参考訳(メタデータ) (2021-10-15T13:53:12Z) - End-to-End Constrained Optimization Learning: A Survey [69.22203885491534]
機械学習アーキテクチャとソルバと最適化手法を統合する作業の調査に焦点を当てている。
これらのアプローチは、問題に対する迅速、近似、構造的、解決策を予測し、論理的推論を可能にする新しいハイブリッド機械学習と最適化手法を開発することを約束します。
論文 参考訳(メタデータ) (2021-03-30T14:19:30Z) - UnitedQA: A Hybrid Approach for Open Domain Question Answering [70.54286377610953]
最近の訓練済みのニューラル言語モデルに基づいて,抽出的および生成的読取能力を高めるために,新しい手法を適用した。
私たちのアプローチは、それぞれNaturalQuestionsとTriviaQAと正確な一致で、以前の最先端のモデルを3.3と2.7ポイント上回る。
論文 参考訳(メタデータ) (2021-01-01T06:36:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。