論文の概要: Understanding the World Through Action
- arxiv url: http://arxiv.org/abs/2110.12543v1
- Date: Sun, 24 Oct 2021 22:33:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 08:44:41.579625
- Title: Understanding the World Through Action
- Title(参考訳): 行動を通して世界を理解する
- Authors: Sergey Levine
- Abstract要約: ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
- 参考スコア(独自算出の注目度): 91.3755431537592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The recent history of machine learning research has taught us that machine
learning methods can be most effective when they are provided with very large,
high-capacity models, and trained on very large and diverse datasets. This has
spurred the community to search for ways to remove any bottlenecks to scale.
Often the foremost among such bottlenecks is the need for human effort,
including the effort of curating and labeling datasets. As a result,
considerable attention in recent years has been devoted to utilizing unlabeled
data, which can be collected in vast quantities. However, some of the most
widely used methods for training on such unlabeled data themselves require
human-designed objective functions that must correlate in some meaningful way
to downstream tasks. I will argue that a general, principled, and powerful
framework for utilizing unlabeled data can be derived from reinforcement
learning, using general purpose unsupervised or self-supervised reinforcement
learning objectives in concert with offline reinforcement learning methods that
can leverage large datasets. I will discuss how such a procedure is more
closely aligned with potential downstream tasks, and how it could build on
existing techniques that have been developed in recent years.
- Abstract(参考訳): 機械学習研究の最近の歴史は、非常に大きくて高容量なモデルが提供され、非常に大きく多様なデータセットで訓練された場合に、機械学習の手法が最も効果的であることを教えてくれた。
これにより、コミュニティは、スケールするボトルネックを取り除く方法を探すようになった。
このようなボトルネックの中で最も重要なのは、データセットのキュレーションやラベル付けなど、人間の努力の必要性だ。
その結果,近年,膨大な量のデータを収集可能なラベルなしデータの利用に注目が集まっている。
しかしながら、そのようなラベル付けされていないデータ自体をトレーニングするために最も広く使われている方法は、ダウンストリームタスクに何らかの意味のある方法で相関しなければならない、人間によって設計された目的関数を必要とする。
大規模データセットを活用可能なオフライン強化学習手法と協調して、汎用的・自己監督的強化学習目標を用いて、ラベルのないデータを活用するための汎用的・原則的・強力なフレームワークを、強化学習から導き出すことができると論じる。
このような手順が下流の潜在的なタスクとどのように密接に一致しているか、そして近年開発された既存の技術に基づいてどのように構築できるかについて論じる。
関連論文リスト
- Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - Deep Active Learning for Data Mining from Conflict Text Corpora [0.0]
本稿では,能動的学習を活用して,安価で高性能な手法を提案する。
このアプローチは、人間の(ゴールドスタンダードの)コーディングに類似したパフォーマンスを示しながら、必要な人間のアノテーションの量を最大99%削減する。
論文 参考訳(メタデータ) (2024-02-02T17:16:23Z) - A Survey of Label-Efficient Deep Learning for 3D Point Clouds [109.07889215814589]
本稿では,点雲のラベル効率学習に関する包括的調査を行う。
本稿では,ラベルの種類によって提供されるデータ前提条件に基づいて,ラベル効率のよい学習手法を整理する分類法を提案する。
それぞれのアプローチについて、問題設定の概要と、関連する進展と課題を示す広範な文献レビューを提供する。
論文 参考訳(メタデータ) (2023-05-31T12:54:51Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Active learning for object detection in high-resolution satellite images [1.6500749121196985]
本研究は,高解像度画像における物体検出に最も有効な能動学習手法について検討することを目的とする。
これは、関連する運用上のユースケースにおけるそのようなテクニックの価値を示す例である: 航空機の検出。
論文 参考訳(メタデータ) (2021-01-07T10:57:38Z) - The Emerging Trends of Multi-Label Learning [45.63795570392158]
エクサバイトのデータは人間によって毎日生成されるため、ビッグデータによってもたらされるマルチラベル学習に対する大きな課題に対処する新たな取り組みの必要性が高まっている。
ビッグデータ時代における新興トレンドとマルチラベル学習の新たな課題を明示的に分析することに焦点を当てた体系的研究の欠如がある。
このミッションを遂行し、今後の研究の方向性と新たな応用を説明するための総合的な調査を求めることが不可欠である。
論文 参考訳(メタデータ) (2020-11-23T03:36:00Z) - Parrot: Data-Driven Behavioral Priors for Reinforcement Learning [79.32403825036792]
そこで本研究では,実験で得られた複雑なインプット・アウトプット関係を事前に学習する手法を提案する。
RLエージェントが新規な動作を試す能力を阻害することなく、この学習が新しいタスクを迅速に学習するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2020-11-19T18:47:40Z) - Sense and Learn: Self-Supervision for Omnipresent Sensors [9.442811508809994]
我々は、生の知覚データから表現や特徴学習のためのSense and Learnというフレームワークを提案する。
これは、面倒なラベル付けプロセスに人間が関与することなく、注釈のないデータから、高レベルで広範囲に有用な特徴を学習できる補助的なタスクで構成されている。
提案手法は、教師付きアプローチと競合する結果を達成し、ネットワークを微調整し、ほとんどの場合、下流タスクを学習することでギャップを埋める。
論文 参考訳(メタデータ) (2020-09-28T11:57:43Z) - An Overview of Deep Semi-Supervised Learning [8.894935073145252]
半教師付き学習とそのディープニューラルネットワークへの応用に対する研究の関心が高まっている。
本稿では,本分野の紹介から始まる深層半教師あり学習の概要について概説する。
論文 参考訳(メタデータ) (2020-06-09T14:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。