論文の概要: Deep Reinforcement Learning: Opportunities and Challenges
- arxiv url: http://arxiv.org/abs/2202.11296v1
- Date: Wed, 23 Feb 2022 03:58:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-24 14:27:52.690662
- Title: Deep Reinforcement Learning: Opportunities and Challenges
- Title(参考訳): 深層強化学習: 機会と課題
- Authors: Yuxi Li
- Abstract要約: この記事は、歴史と最近の研究論文、調査、チュートリアル、講演、ブログ、書籍に基づいている。
研究者、エンジニア、学生、マネージャー、投資家、役員、そしてこの分野についてもっと知りたいと思う人たちなど、読者のさまざまなグループが、この記事に興味を持っているかもしれない。
- 参考スコア(独自算出の注目度): 8.508984854832105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article is a gentle discussion about the field of reinforcement learning
for real life, about opportunities and challenges, with perspectives and
without technical details, touching a broad range of topics. The article is
based on both historical and recent research papers, surveys, tutorials, talks,
blogs, and books. Various groups of readers, like researchers, engineers,
students, managers, investors, officers, and people wanting to know more about
the field, may find the article interesting. In this article, we first give a
brief introduction to reinforcement learning (RL), and its relationship with
deep learning, machine learning and AI. Then we discuss opportunities of RL, in
particular, applications in products and services, games, recommender systems,
robotics, transportation, economics and finance, healthcare, education,
combinatorial optimization, computer systems, and science and engineering. The
we discuss challenges, in particular, 1) foundation, 2) representation, 3)
reward, 4) model, simulation, planning, and benchmarks, 5) learning to learn
a.k.a. meta-learning, 6) off-policy/offline learning, 7) software development
and deployment, 8) business perspectives, and 9) more challenges. We conclude
with a discussion, attempting to answer: "Why has RL not been widely adopted in
practice yet?" and "When is RL helpful?".
- Abstract(参考訳): この記事では、実生活における強化学習の分野、機会と挑戦について、技術的な詳細のない視点で、幅広いトピックに触れながら、穏やかな議論をします。
この記事は、歴史的および最近の研究論文、調査、チュートリアル、講演、ブログ、書籍の両方に基づいている。
研究者、エンジニア、学生、マネージャー、投資家、役員、そしてこの分野についてもっと知りたいと思う人たちなど、読者のさまざまなグループが、この記事に興味を持っているかもしれない。
本稿では、まず、強化学習(RL)とその深層学習、機械学習、AIとの関係について簡単な紹介を行う。
次に,製品やサービス,ゲーム,レコメンダシステム,ロボティクス,輸送,経済とファイナンス,医療,教育,組合せ最適化,コンピュータシステム,科学とエンジニアリングにおけるrlの活用の機会について論じる。
我々は特に課題について論じる。
1)財団法人
2)表現
3)褒美
4)モデル,シミュレーション,計画,ベンチマーク
5)a.a.メタラーニングを学ぶための学習
6) 政治・オフライン学習
7) ソフトウェア開発とデプロイメント。
8)ビジネスの視点,及び
9) さらなる課題。
私たちは最後に、"なぜrlはまだ広く採用されていないのか?"と答えようとして、議論を締め括った。
関連論文リスト
- Cheap Learning: Maximising Performance of Language Models for Social
Data Science Using Minimal Data [1.8692054990918079]
近年発展してきた3つの安価な技術について概観する。
後者では、大規模言語モデルのゼロショットプロンプトの特定の事例について概観する。
我々は,すべての技術に対して優れた性能を示し,特に大規模言語モデルのプロンプトが,非常に低コストで高い精度を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-22T19:00:11Z) - Beyond Factuality: A Comprehensive Evaluation of Large Language Models
as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。
しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。
本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文 参考訳(メタデータ) (2023-10-11T08:22:37Z) - How Can Recommender Systems Benefit from Large Language Models: A Survey [83.90471827695625]
大きな言語モデル(LLM)は、印象的な汎用知性と人間のような能力を示している。
我々は,実世界のレコメンデータシステムにおけるパイプライン全体の観点から,この研究の方向性を包括的に調査する。
論文 参考訳(メタデータ) (2023-06-09T11:31:50Z) - Understanding Reinforcement Learning Algorithms: The Progress from Basic
Q-learning to Proximal Policy Optimization [0.6091702876917281]
強化学習(RL)にはユニークな設定、用語、数学があり、新しい分野や人工知能を脅かすことができる。
本稿では、RLの基本原理を明確かつ簡潔に概説し、RLアルゴリズムの異なるタイプについて述べる。
論文の提示は、1980年代初頭のQ-ラーニングアルゴリズムから、TD3、PPO、オフラインRLといった最先端のアルゴリズムまで、この分野の歴史的進歩と一致している。
論文 参考訳(メタデータ) (2023-03-31T17:24:51Z) - A Survey on Explainable Reinforcement Learning: Concepts, Algorithms,
Challenges [38.70863329476517]
強化学習(Reinforcement Learning, RL)は、インテリジェントエージェントが環境と対話して長期的な目標を達成する、一般的な機械学習パラダイムである。
励ましの結果にもかかわらず、ディープニューラルネットワークベースのバックボーンは、専門家が高いセキュリティと信頼性が不可欠である現実的なシナリオにおいて、訓練されたエージェントを信頼し、採用することを妨げるブラックボックスとして広く見なされている。
この問題を緩和するために、本質的な解釈可能性やポストホックな説明可能性を構築することにより、知的エージェントの内部動作に光を放つための大量の文献が提案されている。
論文 参考訳(メタデータ) (2022-11-12T13:52:06Z) - Machine Learning for Computational Science and Engineering -- a brief
introduction and some critical questions [0.0]
機械学習と/または計算科学と工学の分野の新しい分野について、一般の聴衆や研究者のために書かれた汎用的な記事である。
基本的な方程式やコードも提供されており、読者が基本を理解するのに役立つ。
論文 参考訳(メタデータ) (2021-12-22T17:25:32Z) - RvS: What is Essential for Offline RL via Supervised Learning? [77.91045677562802]
近年の研究では、時間差(TD)のない教師あり学習だけでオフラインRLに極めて効果的であることが示されている。
あらゆる環境スイートにおいて、2層フィードフォワードによる可能性の最大化は競争力がある。
彼らはまた、ランダムデータに対して比較的弱い既存のRvS法の限界を探索する。
論文 参考訳(メタデータ) (2021-12-20T18:55:16Z) - Dive into Deep Learning [119.30375933463156]
この本はJupyterのノートブックでドラフトされており、説明図、数学、インタラクティブな例を自己完結型コードとシームレスに統合している。
私たちのゴールは、(i)誰でも自由に利用できるリソースを提供すること、(ii)応用機械学習科学者になるための出発点を提供するのに十分な技術的な深さを提供すること、(iii)実行可能なコードを含み、実際にどのように問題を解決するかを読者に示すこと、(iv)私たちとコミュニティの両方による迅速なアップデートを可能にすることです。
論文 参考訳(メタデータ) (2021-06-21T18:19:46Z) - Patterns, predictions, and actions: A story about machine learning [59.32629659530159]
この機械学習に関する大学院教科書は、データのパターンが予測と連続的なアクションをどのようにサポートするかを物語っている。
因果関係の自己完結した導入、因果推論の実践、逐次的な意思決定、強化学習は、読者に行動とその結果について推論するための概念とツールを与える。
論文 参考訳(メタデータ) (2021-02-10T03:42:03Z) - Curriculum Learning for Reinforcement Learning Domains: A Framework and
Survey [53.73359052511171]
強化学習(Reinforcement Learning, RL)は、エージェントが限られた環境フィードバックしか持たないシーケンシャルな意思決定タスクに対処するための一般的なパラダイムである。
本稿では、RLにおけるカリキュラム学習(CL)の枠組みを提案し、既存のCLメソッドを仮定、能力、目標の観点から調査・分類する。
論文 参考訳(メタデータ) (2020-03-10T20:41:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。