論文の概要: OMNI-EPIC: Open-endedness via Models of human Notions of Interestingness with Environments Programmed in Code
- arxiv url: http://arxiv.org/abs/2405.15568v2
- Date: Mon, 07 Oct 2024 23:21:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-10 14:28:04.421333
- Title: OMNI-EPIC: Open-endedness via Models of human Notions of Interestingness with Environments Programmed in Code
- Title(参考訳): OMNI-EPIC:コードでプログラムされた環境に対する人間の関心の表記モデルによるオープンディペンデンス
- Authors: Maxence Faldor, Jenny Zhang, Antoine Cully, Jeff Clune,
- Abstract要約: オープンエンドおよびAI生成アルゴリズムは、ますます複雑なタスクを無期限に生成し、解決することを目的としている。
この壮大なビジョンを達成するためには、学習は潜在的なタスクの膨大な範囲内で行われなければならない。
OMNI-EPICという新しいフレームワークを導入する。
- 参考スコア(独自算出の注目度): 6.067502582087556
- License:
- Abstract: Open-ended and AI-generating algorithms aim to continuously generate and solve increasingly complex tasks indefinitely, offering a promising path toward more general intelligence. To accomplish this grand vision, learning must occur within a vast array of potential tasks. Existing approaches to automatically generating environments are constrained within manually predefined, often narrow distributions of environment, limiting their ability to create any learning environment. To address this limitation, we introduce a novel framework, OMNI-EPIC, that augments previous work in Open-endedness via Models of human Notions of Interestingness (OMNI) with Environments Programmed in Code (EPIC). OMNI-EPIC leverages foundation models to autonomously generate code specifying the next learnable (i.e., not too easy or difficult for the agent's current skill set) and interesting (e.g., worthwhile and novel) tasks. OMNI-EPIC generates both environments (e.g., an obstacle course) and reward functions (e.g., progress through the obstacle course quickly without touching red objects), enabling it, in principle, to create any simulatable learning task. We showcase the explosive creativity of OMNI-EPIC, which continuously innovates to suggest new, interesting learning challenges. We also highlight how OMNI-EPIC can adapt to reinforcement learning agents' learning progress, generating tasks that are of suitable difficulty. Overall, OMNI-EPIC can endlessly create learnable and interesting environments, further propelling the development of self-improving AI systems and AI-Generating Algorithms. Project website with videos: https://dub.sh/omniepic
- Abstract(参考訳): オープンエンドおよびAI生成アルゴリズムは、ますます複雑なタスクを無期限に生成し、解決することを目的としており、より汎用的なインテリジェンスへの有望な道を提供する。
この壮大なビジョンを達成するためには、学習は潜在的なタスクの膨大な範囲内で行われなければならない。
環境を自動的に生成するための既存のアプローチは、手動で事前定義された、しばしば狭い環境分布内で制約され、学習環境を作成する能力を制限する。
この制限に対処するため、我々は、OMNI-EPICという新しいフレームワークを導入し、EPIC(Environments Programmed in Code)を用いた人間興味の表記モデル(OMNI)を通して、オープンエンディネスにおける過去の作業を拡大する。
OMNI-EPICは、基礎モデルを利用して、次の学習可能なコード(エージェントの現在のスキルセットでは簡単でも難しいものでもない)と興味深いタスク(例えば、価値のあるもの、新しいもの)を自律的に生成する。
OMNI-EPICは、環境(例えば障害物コース)と報酬関数(例えば、赤い物体に触れることなく障害物コースを素早く進行させる)の両方を生成し、原則として、シミュラブルな学習タスクを作成することができる。
我々は,OMNI-EPICの爆発的創造性を紹介する。
また、OMNI-EPICが強化学習エージェントの学習進捗にどのように適応し、適切な困難を伴うタスクを生成するかを強調した。
全体として、OMNI-EPICは無限に学習可能で興味深い環境を作成でき、自己改善型AIシステムとAI生成アルゴリズムの開発をさらに促進します。
ビデオ付きプロジェクトWebサイト: https://dub.sh/omniepic
関連論文リスト
- A Survey on Robotics with Foundation Models: toward Embodied AI [30.999414445286757]
近年のコンピュータビジョン,自然言語処理,マルチモーダリティ学習の進歩は,基礎モデルが特定のタスクに対して超人的能力を持つことを示している。
この調査は、ロボット工学の基礎モデルの包括的で最新の概要を提供し、自律的な操作に焦点を当て、高レベルの計画と低レベルの制御を包含することを目的としている。
論文 参考訳(メタデータ) (2024-02-04T07:55:01Z) - A Survey of Imitation Learning: Algorithms, Recent Developments, and
Challenges [9.288673880680033]
模倣学習(英: mimicion learning、IL)とは、専門家の行動を模倣することによって望ましい行動が学習される過程である。
本稿では、ILの概要と、その基礎となる前提とアプローチの概要について述べる。
また、この分野における最近の進歩と新たな研究分野についても詳述している。
論文 参考訳(メタデータ) (2023-09-05T11:56:07Z) - OpenAGI: When LLM Meets Domain Experts [51.86179657467822]
ヒューマン・インテリジェンス(HI)は、複雑なタスクを解くための基本的なスキルの組み合わせに長けている。
この機能は人工知能(AI)にとって不可欠であり、包括的なAIエージェントに組み込まれるべきである。
マルチステップで現実的なタスクを解決するために設計されたオープンソースのプラットフォームであるOpenAGIを紹介します。
論文 参考訳(メタデータ) (2023-04-10T03:55:35Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Intrinsically Motivated Goal-Conditioned Reinforcement Learning: a Short
Survey [21.311739361361717]
開発アプローチは、学習エージェントは自身の問題を解決するために生成、選択、学習しなければならないと主張する。
近年、発達的アプローチと深層強化学習(RL)手法の融合が見られ、発達的機械学習の新しい領域を形成している。
本稿では,深層rlと発達的アプローチの交点におけるこれらの手法の類型論,最近のアプローチのサーベイ,今後の展望について述べる。
論文 参考訳(メタデータ) (2020-12-17T18:51:40Z) - AllenAct: A Framework for Embodied AI Research [37.25733386769186]
エージェントは、エゴセントリックな観察から環境とのインタラクションを通じてタスクを完了させることを学ぶ。
AllenActはモジュール型で柔軟な学習フレームワークで、Embodied AI研究のユニークな要件に重点を置いて設計されている。
論文 参考訳(メタデータ) (2020-08-28T17:35:22Z) - Learning Compositional Neural Programs for Continuous Control [62.80551956557359]
スパース逆連続制御問題に対する新しい解法を提案する。
我々のソリューションはAlphaNPI-Xと呼ばれ、学習の3つの段階を含む。
我々はAlphaNPI-Xがスパース操作の課題に効果的に取り組むことを実証的に示す。
論文 参考訳(メタデータ) (2020-07-27T08:27:14Z) - Learning with AMIGo: Adversarially Motivated Intrinsic Goals [63.680207855344875]
AMIGoは、Adversarially Motivated Intrinsic Goalsを提案するゴール生成教師である。
提案手法は, 提案する目標の自然なカリキュラムを生成し, エージェントが究極的には, 手続き的に生成する課題を解くことができることを示す。
論文 参考訳(メタデータ) (2020-06-22T10:22:08Z) - AI from concrete to abstract: demystifying artificial intelligence to
the general public [0.0]
本稿では,コンクリートから抽象的(AIcon2abs)への新たな方法論,AIについて述べる。
主な戦略は、人工知能のデミスティフィケーションを促進することである。
WiSARDの軽量化により、トレーニングタスクと分類タスクの視覚化と理解が容易になる。
論文 参考訳(メタデータ) (2020-06-07T01:14:06Z) - Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Humanlike
Common Sense [142.53911271465344]
我々は、次世代のAIは、新しいタスクを解決するために、人間のような「暗黒」の常識を取り入れなければならないと論じている。
我々は、人間のような常識を持つ認知AIの5つの中核領域として、機能、物理学、意図、因果性、実用性(FPICU)を識別する。
論文 参考訳(メタデータ) (2020-04-20T04:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。