論文の概要: Unsupervisedly Learned Representations: Should the Quest be Over?
- arxiv url: http://arxiv.org/abs/2001.07495v5
- Date: Thu, 26 Sep 2024 11:42:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-09 15:57:56.176194
- Title: Unsupervisedly Learned Representations: Should the Quest be Over?
- Title(参考訳): 教師なしの学習表現:クエストは終わりか?
- Authors: Daniel N. Nissani,
- Abstract要約: 強化学習が動物と同じ精度の表現を学習できることを実証する。
これらの観察の要旨は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: After four decades of research there still exists a Classification accuracy gap of about 20% between our best Unsupervisedly Learned Representations methods and the accuracy rates achieved by intelligent animals. It thus may well be that we are looking in the wrong direction. A possible solution to this puzzle is presented. We demonstrate that Reinforcement Learning can learn representations which achieve the same accuracy as that of animals. Our main modest contribution lies in the observations that: a. when applied to a real world environment Reinforcement Learning does not require labels, and thus may be legitimately considered as Unsupervised Learning, and b. in contrast, when Reinforcement Learning is applied in a simulated environment it does inherently require labels and should thus be generally be considered as Supervised Learning. The corollary of these observations is that further search for Unsupervised Learning competitive paradigms which may be trained in simulated environments may be futile.
- Abstract(参考訳): 研究から40年経っても、最良の教師なし学習表現法と知的動物が達成した精度率との間には、およそ20%の分類精度のギャップが残っている。
したがって、間違った方向を向いているのかもしれない。
このパズルの解法が提示される。
強化学習が動物と同じ精度の表現を学習できることを実証する。
私たちの主な貢献は、以下の観察にある。
a) 実環境に適用する場合は、強化学習はラベルを必要としないため、正当に教師なし学習とみなすことができる。
対照的に、強化学習をシミュレーション環境で適用する場合は、本質的にラベルを必要とするため、一般的には監督学習とみなすべきである。
これらの観察の要点は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
関連論文リスト
- Unsupervised Representation Learning in Partially Observable Atari Games [10.299850596045395]
状態表現学習は、環境の潜伏要因を捉えることを目的としている。
コントラスト法は,従来の状態表現学習研究において,生成モデルよりも優れていた。
本稿では、部分的に観測可能な状態に対する教師なし状態表現学習スキームを作成する。
論文 参考訳(メタデータ) (2023-03-13T19:34:10Z) - Contrastive Learning for OOD in Object detection [0.0]
コントラスト学習は、一般的に自己指導型学習に適用される。
大規模なバッチサイズとメモリバンクは、トレーニングを難しく、遅くしました。
その結果,画像分類とオブジェクト検出において,教師付きコントラスト学習に匹敵する結果が得られた。
論文 参考訳(メタデータ) (2022-08-12T01:51:50Z) - Chaos is a Ladder: A New Theoretical Understanding of Contrastive
Learning via Augmentation Overlap [64.60460828425502]
コントラスト学習の下流性能に関する新たな保証を提案する。
我々の新しい理論は、攻撃的なデータ強化の下で、異なるクラス内サンプルのサポートがより重なり合うという知見に基づいている。
本稿では、下流の精度とよく一致した教師なしモデル選択距離ARCを提案する。
論文 参考訳(メタデータ) (2022-03-25T05:36:26Z) - Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。
RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。
この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文 参考訳(メタデータ) (2021-12-17T16:28:06Z) - Learning more skills through optimistic exploration [5.973112138143177]
教師なしのスキル学習の目的により、エージェントは外因的な報酬がなければ、行動の豊富なレパートリーを学習することができる。
固有の探索問題は、新しい状態が実際に遭遇したとき、判別器は正確で確実なスキル分類を生成するのに十分な訓練データを見られなかった。
我々は、差別者のアンサンブルを訓練し、その不一致に対して政策に報いる情報獲得補助目的を導出する。
我々の目的は、十分な訓練例を見ていない差別者から生じる不確実性を直接推定し、本質的な報酬を真の目的に合わせたものにすることである。
論文 参考訳(メタデータ) (2021-07-29T17:58:04Z) - Curious Representation Learning for Embodied Intelligence [81.21764276106924]
近年,自己指導型表現学習は顕著な成功を収めている。
しかし、真にインテリジェントなエージェントを構築するためには、環境から学習できる表現学習アルゴリズムを構築する必要がある。
本稿では,強化学習方針と視覚的表現モデルを同時に学習する,好奇心をそそる表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-03T17:59:20Z) - Can Semantic Labels Assist Self-Supervised Visual Representation
Learning? [194.1681088693248]
近隣環境におけるコントラスト調整(SCAN)という新しいアルゴリズムを提案する。
一連のダウンストリームタスクにおいて、SCANは従来の完全教師付きおよび自己教師付きメソッドよりも優れたパフォーマンスを達成する。
本研究は, セマンティックラベルが自己指導的手法の補助に有用であることを明らかにする。
論文 参考訳(メタデータ) (2020-11-17T13:25:00Z) - A Sober Look at the Unsupervised Learning of Disentangled
Representations and their Evaluation [63.042651834453544]
モデルとデータの両方に帰納的バイアスを伴わずに,非教師なしの非教師付き表現学習は不可能であることを示す。
異なる手法は、対応する損失によって「強化」された特性を効果的に強制するが、よく見分けられたモデルは監督なしでは特定できないように見える。
以上の結果から,遠絡学習における今後の研究は,帰納的バイアスと(単純に)監督の役割を明確化すべきであることが示唆された。
論文 参考訳(メタデータ) (2020-10-27T10:17:15Z) - Rethinking Class Relations: Absolute-relative Supervised and
Unsupervised Few-shot Learning [157.62595449130973]
本稿では,現在の数ショット学習法における単純化型クラスモデリングの基本的問題について検討する。
本稿では,ラベル情報をフル活用して画像表現を洗練するための,絶対相対学習パラダイムを提案する。
論文 参考訳(メタデータ) (2020-01-12T12:25:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。