論文の概要: AI for the Open-World: the Learning Principles
- arxiv url: http://arxiv.org/abs/2504.14751v1
- Date: Sun, 20 Apr 2025 22:22:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 20:21:18.870367
- Title: AI for the Open-World: the Learning Principles
- Title(参考訳): AI for the Open-World: the Learning Principles
- Authors: Jianyu Zhang,
- Abstract要約: この論文は、オープンワールドのためのAIを構築するために必要な学習原則を探求する。
学習原則を使用するためのテクニックを提案し、学習原則を検証するために大規模な実験を行う。
- 参考スコア(独自算出の注目度): 4.357691364971652
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: During the past decades, numerous successes of AI has been made on "specific capabilities", named closed-world, such as artificial environments or specific real-world tasks. This well-defined narrow capability brings two nice benefits, a clear criterion of success and the opportunity to collect a lot of examples. The criteria not only reveal whether a machine has achieved a goal, but reveal how the machine falls short of the goal. As a result, human designers can fix the problems one after the other until the machine is deemed good enough for the task. Furthermore, the large set of collected examples reduces the difficulty of this problem-fixing process (by the central limit theorem). Do the success in closed-world translate into broad open-world, where a machine is required to perform any task that a human could possibly undertake with fewer examples and less priori knowledge from human designers? No. Because competence in a specific task provides little insight in handling other tasks, the valuable criteria for specific tasks become helpless when handling broader unseen tasks. Furthermore, due to the shortage of examples in unseen tasks, central limit theorem does not stand on our side. At the end, human designers lose the oscilloscope to "hack" an AI system for the open-world. Achieving AI for the open-world requires unique learning principles and innovated techniques, which are different from the ones in building AI for the closed-world. This thesis explores necessary learning principles required to construct AI for the open-world, including rich features (analogy a large tool box), disentangled representation (an organized tool box), and inference-time learning (a tool-savvy hand). Driven by the learning principles, this thesis further proposes techniques to use the learning principles, conducts enormous large-scale experiments to verify the learning principles.
- Abstract(参考訳): 過去数十年間、人工知能の多くの成功は、人工環境や特定の現実世界タスクのような「クローズドワールド」と呼ばれる「特定の能力」でなされてきた。
この明確に定義された狭い能力は、2つの優れたメリット、成功の明確な基準、そして多くのサンプルを集める機会をもたらします。
基準は、マシンが目標を達成したかどうかを明らかにするだけでなく、マシンが目標に届かないかを明らかにする。
結果として、人間設計者は、機械がタスクに十分適していると判断されるまで、問題を次々に解決することができる。
さらに、収集されたサンプルの大規模な集合は(中心極限定理によって)この問題修正過程の難しさを減少させる。
クローズドワールドの成功は広範にオープンワールドに変換されますか?
いいえ。
特定のタスクの能力は、他のタスクの処理に関する洞察をほとんど提供しないため、より広い未確認タスクを扱う場合、特定のタスクの貴重な基準は役に立たない。
さらに、目に見えないタスクの例が不足しているため、中心極限定理は我々の側には存在しない。
最後に、人間のデザイナーは、オープンワールドのためのAIシステムを「ハック」するためにオシロスコープを失います。
オープンワールドのためのAIを実現するには、クローズドワールドのためのAIを構築する場合とは異なる、ユニークな学習原則と革新的テクニックが必要です。
この論文では、リッチな機能(大きなツールボックスの分析)、非絡み合った表現(組織化されたツールボックス)、推論時学習(ツールに精通した手)など、オープンワールドのためにAIを構築するために必要な学習原則を探求する。
学習原則に基づいて、この論文はさらに、学習原則を使用するためのテクニックを提案し、学習原則を検証するために巨大な大規模な実験を行う。
関連論文リスト
- Open-world Machine Learning: A Review and New Outlooks [83.6401132743407]
本稿では,新たなオープンワールド機械学習パラダイムを包括的に紹介することを目的としている。
研究者がそれぞれの分野でより強力なAIシステムを構築するのを支援し、人工知能の開発を促進することを目的としている。
論文 参考訳(メタデータ) (2024-03-04T06:25:26Z) - General Purpose Artificial Intelligence Systems (GPAIS): Properties,
Definition, Taxonomy, Societal Implications and Responsible Governance [16.030931070783637]
汎用人工知能システム(GPAIS)は、これらのAIシステムを指すものとして定義されている。
これまで、人工知能の可能性は、まるで人間であるかのように知的タスクを実行するのに十分強力であり、あるいはそれを改善することさえ可能であり、いまだに願望、フィクションであり、我々の社会にとっての危険であると考えられてきた。
本研究は,GPAISの既存の定義について論じ,その特性や限界に応じて,GPAISの種類間で段階的な分化を可能にする新しい定義を提案する。
論文 参考訳(メタデータ) (2023-07-26T16:35:48Z) - Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from
Offline Data [101.43350024175157]
自己指導型学習は、制御戦略を学ぶのに必要な人間のアノテーションとエンジニアリングの労力を減らす可能性がある。
我々の研究は、強化学習(RL)自体が自己監督的な問題であることを示す先行研究に基づいている。
コントラスト学習に基づく自己教師付きRLアルゴリズムは,実世界の画像に基づくロボット操作タスクを解くことができることを示す。
論文 参考訳(メタデータ) (2023-06-06T01:36:56Z) - TaskMatrix.AI: Completing Tasks by Connecting Foundation Models with
Millions of APIs [71.7495056818522]
私たちは、基礎モデルと数百万のAPIを結合してタスク補完を行う、新しいAIエコシステムとしてTaskMatrix.AIを紹介します。
このようなエコシステムを構築するためのビジョンを示し、それぞれの重要なコンポーネントを説明し、このビジョンの実現可能性と次に取り組むべき主な課題の両方を説明するために研究ケースを使用します。
論文 参考訳(メタデータ) (2023-03-29T03:30:38Z) - Mastering Diverse Domains through World Models [43.382115013586535]
本稿では,150以上のタスクにまたがる特殊メソッドを1つの構成で高速化するDreamerV3を提案する。
Dreamerは、Minecraftのダイヤモンドを人間のデータやカリキュラムなしでゼロから収集する最初のアルゴリズムだ。
論文 参考訳(メタデータ) (2023-01-10T18:12:16Z) - Impossibility of Collective Intelligence [10.107996426462604]
異種環境をまたいで学習できる有理学習アルゴリズムを設計することは理論的には不可能であることを示す。
全ての公理と互換性のある唯一の実現可能なアルゴリズムは、標準的な経験的リスク最小化である。
その結果、研究者にとって最も大きな障害の一つとして、環境間の情報的非互換性が明らかとなった。
論文 参考訳(メタデータ) (2022-06-05T07:58:39Z) - Divide & Conquer Imitation Learning [75.31752559017978]
模倣学習は学習プロセスをブートストラップするための強力なアプローチである。
本稿では,専門的軌道の状態から複雑なロボットタスクを模倣する新しいアルゴリズムを提案する。
提案手法は,非ホロノミックナビゲーションタスクを模倣し,非常に高いサンプル効率で複雑なロボット操作タスクにスケールすることを示す。
論文 参考訳(メタデータ) (2022-04-15T09:56:50Z) - From Machine Learning to Robotics: Challenges and Opportunities for
Embodied Intelligence [113.06484656032978]
記事は、インテリジェンスが機械学習技術の進歩の鍵を握っていると主張している。
私たちは、インテリジェンスを具体化するための課題と機会を強調します。
本稿では,ロボット学習の最先端性を著しく向上させる研究の方向性を提案する。
論文 参考訳(メタデータ) (2021-10-28T16:04:01Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。