論文の概要: The Need for a Big World Simulator: A Scientific Challenge for Continual Learning
- arxiv url: http://arxiv.org/abs/2408.02930v1
- Date: Tue, 6 Aug 2024 03:26:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-07 14:59:44.537594
- Title: The Need for a Big World Simulator: A Scientific Challenge for Continual Learning
- Title(参考訳): ビッグワールドシミュレーターの必要性 : 継続的な学習への科学的挑戦
- Authors: Saurabh Kumar, Hong Jun Jeon, Alex Lewandowski, Benjamin Van Roy,
- Abstract要約: 小さなエージェント、大きな世界」のフレームは、継続的な学習の必要性を動機づける概念的な視点を提供する。
適切に機能させるためには、エージェントは適切な情報を取り込み、保持し、放出するように慎重に設計されなければならない。
本稿では,将来のシミュレート環境設計のための2つのデシデラタを形式化する。
- 参考スコア(独自算出の注目度): 19.6823944850791
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The "small agent, big world" frame offers a conceptual view that motivates the need for continual learning. The idea is that a small agent operating in a much bigger world cannot store all information that the world has to offer. To perform well, the agent must be carefully designed to ingest, retain, and eject the right information. To enable the development of performant continual learning agents, a number of synthetic environments have been proposed. However, these benchmarks suffer from limitations, including unnatural distribution shifts and a lack of fidelity to the "small agent, big world" framing. This paper aims to formalize two desiderata for the design of future simulated environments. These two criteria aim to reflect the objectives and complexity of continual learning in practical settings while enabling rapid prototyping of algorithms on a smaller scale.
- Abstract(参考訳): 小さなエージェント、大きな世界」のフレームは、継続的な学習の必要性を動機づける概念的な視点を提供する。
考えでは、もっと大きな世界で活動している小さなエージェントは、世界が提供しなければならないすべての情報を保存できない。
適切に機能させるためには、エージェントは適切な情報を取り込み、保持し、放出するように慎重に設計されなければならない。
高性能連続学習エージェントの開発を可能にするため,多くの合成環境が提案されている。
しかし、これらのベンチマークは「小さなエージェント、大きな世界」フレーミングに対する不自然な分布シフトや忠実さの欠如など、制限に悩まされている。
本稿では,将来のシミュレート環境設計のための2つのデシデラタを形式化する。
これらの2つの基準は、アルゴリズムの高速なプロトタイピングを小さなスケールで実現しつつ、実践的な環境での継続的な学習の目的と複雑さを反映することを目的としている。
関連論文リスト
- Object-centric proto-symbolic behavioural reasoning from pixels [0.0]
我々は、ピクセルから学習し、その環境を解釈し、制御し、推論する脳に触発されたディープラーニングアーキテクチャを提案する。
その結果,エージェントは創発的条件付き行動推論を学習できることがわかった。
提案アーキテクチャは、教師なし学習における重要な帰納バイアスとして、接地オブジェクト表現の操作方法を示す。
論文 参考訳(メタデータ) (2024-11-26T13:54:24Z) - DREAMWALKER: Mental Planning for Continuous Vision-Language Navigation [107.5934592892763]
本稿では,世界モデルに基づくVLN-CEエージェントDREAMWALKERを提案する。
世界モデルは、複雑な連続環境の視覚的、位相的、動的特性を要約するために構築される。
コストのかかるアクションを実行する前に、そのような抽象的な世界で可能な計画を完全にシミュレートし、評価することができる。
論文 参考訳(メタデータ) (2023-08-14T23:45:01Z) - Brain in a Vat: On Missing Pieces Towards Artificial General
Intelligence in Large Language Models [83.63242931107638]
本稿では,知的エージェントの4つの特徴について述べる。
実世界の物体との活発な関わりは、概念的表現を形成するためのより堅牢な信号をもたらすと我々は主張する。
我々は、人工知能分野における将来的な研究の方向性を概説して結論付ける。
論文 参考訳(メタデータ) (2023-07-07T13:58:16Z) - OPEn: An Open-ended Physics Environment for Learning Without a Task [132.6062618135179]
オープンエンドな物理環境で学んだ世界のモデルが、特定のタスクを伴わずに、下流の物理推論タスクに再利用できるかどうかについて検討する。
我々は,OPEn(Open-ended Physics ENvironment)のベンチマークを構築し,この環境における学習表現をテストするためのいくつかのタスクを明示的に設計する。
その結果、教師なしのコントラスト学習を表現学習に用いたエージェントと、探索のためのインパクト駆動学習が最良の結果となった。
論文 参考訳(メタデータ) (2021-10-13T17:48:23Z) - Continual Learning of Control Primitives: Skill Discovery via
Reset-Games [128.36174682118488]
エージェントが最小限の監督力でスキルを習得できる方法を示す。
私たちは、エージェントを学習タスクの初期状態の広いセットに"リセット"する必要があるという洞察を利用して、多様な"リセットスキル"を学ぶための自然な設定を提供します。
論文 参考訳(メタデータ) (2020-11-10T18:07:44Z) - WordCraft: An Environment for Benchmarking Commonsense Agents [107.20421897619002]
我々はLittle Alchemy 2.0をベースとしたRL環境であるWordCraftを提案する。
この軽量環境は、現実のセマンティクスにインスパイアされたエンティティとリレーションに基づいて実行され、構築される。
論文 参考訳(メタデータ) (2020-07-17T18:40:46Z) - Mutual Information Maximization for Robust Plannable Representations [82.83676853746742]
モデルに基づく強化学習のための情報理論表現学習アルゴリズムMIROを提案する。
提案手法は, 邪魔や散らかったシーンの存在下で, 再建目的よりも頑健であることを示す。
論文 参考訳(メタデータ) (2020-05-16T21:58:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。