論文の概要: Lifelong Learning Metrics
- arxiv url: http://arxiv.org/abs/2201.08278v1
- Date: Thu, 20 Jan 2022 16:29:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-21 13:27:10.979511
- Title: Lifelong Learning Metrics
- Title(参考訳): 生涯学習メトリクス
- Authors: Alexander New and Megan Baker and Eric Nguyen and Gautam Vallabha
- Abstract要約: DARPA Lifelong Learning Machines (L2M) プログラムは、人工知能(AI)システムの進歩を目指している。
本論文は、生涯学習シナリオを実行するエージェントのパフォーマンスの構築と特徴付けのためのフォーマリズムを概説する。
- 参考スコア(独自算出の注目度): 63.8376359764052
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The DARPA Lifelong Learning Machines (L2M) program seeks to yield advances in
artificial intelligence (AI) systems so that they are capable of learning (and
improving) continuously, leveraging data on one task to improve performance on
another, and doing so in a computationally sustainable way. Performers on this
program developed systems capable of performing a diverse range of functions,
including autonomous driving, real-time strategy, and drone simulation. These
systems featured a diverse range of characteristics (e.g., task structure,
lifetime duration), and an immediate challenge faced by the program's testing
and evaluation team was measuring system performance across these different
settings. This document, developed in close collaboration with DARPA and the
program performers, outlines a formalism for constructing and characterizing
the performance of agents performing lifelong learning scenarios.
- Abstract(参考訳): DARPA Lifelong Learning Machines(L2M)プログラムは、人工知能(AI)システムの進歩を生かして、継続的に学習(および改善)し、あるタスク上のデータを活用して、別のタスクのパフォーマンスを改善し、計算的に持続可能な方法で実行できるようにする。
このプログラムの出演者は、自動運転、リアルタイム戦略、ドローンシミュレーションなど、さまざまな機能を実行することができるシステムを開発した。
これらのシステムには様々な特性(例えばタスク構造、寿命など)があり、プログラムのテストと評価チームが直面した課題は、システムの性能を異なる設定で測定することであった。
この文書はDARPAとプログラムパフォーマーと密接なコラボレーションで開発され、生涯学習シナリオを実行するエージェントのパフォーマンスの構築と特徴付けのための形式主義を概説している。
関連論文リスト
- A Comparison of Prompt Engineering Techniques for Task Planning and Execution in Service Robotics [16.064583670720587]
サービスロボティクスにおける高レベルのタスク計画と実行の適用において、迅速なエンジニアリング技術とそれらの組み合わせを比較した。
そこで本研究では,タスクの多様なセットとシミュレーションにおける機能セットを定義し,タスク完了の正確さと実行時間を測定する。
論文 参考訳(メタデータ) (2024-10-30T13:22:55Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Empowering Private Tutoring by Chaining Large Language Models [87.76985829144834]
本研究は,最先端の大規模言語モデル(LLM)を活用した,本格的な知的チューリングシステムの開発を探求する。
このシステムは、相互に接続された3つのコアプロセス(相互作用、反射、反応)に分けられる。
各プロセスは LLM ベースのツールと動的に更新されたメモリモジュールによって実装される。
論文 参考訳(メタデータ) (2023-09-15T02:42:03Z) - Reinforcement Learning in Robotic Motion Planning by Combined
Experience-based Planning and Self-Imitation Learning [7.919213739992465]
高品質で代表的なデータは、Imitation Learning(IL)とReinforcement Learning(RL)ベースのモーションプランニングタスクに不可欠である。
本稿では,学習アーキテクチャに経験に基づくプランニングを組み込むSILP+アルゴリズムを提案する。
様々な実験結果から,SILP+は複雑な運動計画タスクにおいて,トレーニング効率が向上し,より安定した成功率が得られることが示された。
論文 参考訳(メタデータ) (2023-06-11T19:47:46Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。
新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。
我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文 参考訳(メタデータ) (2021-04-16T16:38:02Z) - Guiding Robot Exploration in Reinforcement Learning via Automated
Planning [6.075903612065429]
強化学習(Reinforcement Learning, RL)は、エージェントが試行錯誤経験から長期的な目標を達成するための学習を可能にする。
自動計画は、行動知識を使用してタスクを達成するための計画を計算することを目的としている。
我々は、RLエージェントが行動知識で推論できるようにガイドダイナQ(GDQ)を開発した。
論文 参考訳(メタデータ) (2020-04-23T21:03:30Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z) - Leveraging Rationales to Improve Human Task Performance [15.785125079811902]
計算システムの性能が人間のユーザを上回ることを考えれば、人間のパフォーマンスを改善するために説明可能なAI能力を活用することができるだろうか?
本稿では,ユーティリティベースの計算手法の合理性を自動生成するRationale-Generating Algorithmを紹介する。
以上の結果から,本手法は人事性能の統計的改善につながる有理性を生み出すことが示唆された。
論文 参考訳(メタデータ) (2020-02-11T04:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。