論文の概要: NovPhy: A Testbed for Physical Reasoning in Open-world Environments
- arxiv url: http://arxiv.org/abs/2303.01711v2
- Date: Sat, 5 Aug 2023 12:47:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 23:48:38.598315
- Title: NovPhy: A Testbed for Physical Reasoning in Open-world Environments
- Title(参考訳): NovPhy: オープンワールド環境における物理推論のためのテストベッド
- Authors: Chathura Gamage, Vimukthini Pinto, Cheng Xue, Peng Zhang, Ekaterina
Nikonova, Matthew Stephenson, Jochen Renz
- Abstract要約: 現実の世界では、私たちはこれまで遭遇したことのない新しい状況に直面しています。
エージェントは、オープンワールドの物理的環境で適切に操作するために、新規性の影響下で機能する能力を持つ必要がある。
我々は,新規性の存在下での物理的シナリオをエージェントが説明する必要がある新しいテストベッド,NovPhyを提案する。
- 参考スコア(独自算出の注目度): 5.736794130342911
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the emergence of AI systems that interact with the physical
environment, there is an increased interest in incorporating physical reasoning
capabilities into those AI systems. But is it enough to only have physical
reasoning capabilities to operate in a real physical environment? In the real
world, we constantly face novel situations we have not encountered before. As
humans, we are competent at successfully adapting to those situations.
Similarly, an agent needs to have the ability to function under the impact of
novelties in order to properly operate in an open-world physical environment.
To facilitate the development of such AI systems, we propose a new testbed,
NovPhy, that requires an agent to reason about physical scenarios in the
presence of novelties and take actions accordingly. The testbed consists of
tasks that require agents to detect and adapt to novelties in physical
scenarios. To create tasks in the testbed, we develop eight novelties
representing a diverse novelty space and apply them to five commonly
encountered scenarios in a physical environment. According to our testbed
design, we evaluate two capabilities of an agent: the performance on a novelty
when it is applied to different physical scenarios and the performance on a
physical scenario when different novelties are applied to it. We conduct a
thorough evaluation with human players, learning agents, and heuristic agents.
Our evaluation shows that humans' performance is far beyond the agents'
performance. Some agents, even with good normal task performance, perform
significantly worse when there is a novelty, and the agents that can adapt to
novelties typically adapt slower than humans. We promote the development of
intelligent agents capable of performing at the human level or above when
operating in open-world physical environments. Testbed website:
https://github.com/phy-q/novphy
- Abstract(参考訳): 物理的環境と相互作用するAIシステムの出現により、これらのAIシステムに物理的推論機能を統合することへの関心が高まっている。
しかし、実際の物理的環境で動作する物理推論能力だけで十分だろうか?
現実の世界では、これまで遭遇したことのない新しい状況に常に直面する。
人間として、我々はこれらの状況にうまく適応する能力がある。
同様に、エージェントは、オープンワールドの物理的環境で適切に動作するために、ノベルティの影響下で機能する能力を持つ必要がある。
このようなAIシステムの開発を容易にするために,エージェントが新規性の存在下で物理的シナリオを推論し,それに応じて行動を取ることを必要とする新しいテストベッド,NovPhyを提案する。
テストベッドは、エージェントが物理シナリオの新規性を検出し、適応するよう要求するタスクで構成されている。
テストベッドでタスクを作成するために、様々なノベルティ空間を表す8つのノベルティを開発し、物理環境でよく遭遇する5つのシナリオに適用する。
テストベッド設計では,異なる物理シナリオに適用された場合の新規性に対する性能と,異なる新規性を適用した場合の物理的シナリオにおける性能の2つの能力を評価する。
我々は,人間,学習エージェント,ヒューリスティックエージェントを用いて徹底的な評価を行う。
評価の結果,人間のパフォーマンスはエージェントのパフォーマンスをはるかに超えることがわかった。
一部のエージェントは、正常なタスクのパフォーマンスが良好であっても、新規性がある場合には著しく悪化し、新規性に適応できるエージェントは通常、人間よりも遅く適応する。
我々は,オープンワールドの物理環境での運用において,人間レベル以上の能力を持つ知的エージェントの開発を促進する。
Testbed Webサイト: https://github.com/phy-q/novphy
関連論文リスト
- HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - WebArena: A Realistic Web Environment for Building Autonomous Agents [92.3291458543633]
我々は、非常に現実的で再現可能な言語誘導エージェントのための環境を構築する。
我々は,Web上でタスクを実行するエージェントに着目し,4つの共通ドメインから完全に機能するWebサイトを持つ環境を構築する。
タスク完了の関数的正しさを評価することに焦点を当てたベンチマークタスクのセットをリリースする。
論文 参考訳(メタデータ) (2023-07-25T22:59:32Z) - Novelty Accommodating Multi-Agent Planning in High Fidelity Simulated
Open World [0.0]
ノベルティ(英: Novelty)は、環境のコア特性、組成、力学を変化させる予期せぬ現象である。
これまでの研究では、新規性はエージェントのパフォーマンスに破滅的な影響を及ぼすことが示されている。
本研究では、軍事領域の現実的な高忠実度シミュレータにおいて、ドメイン非依存のAIエージェントが、斬新な動作と推論を成功させるために適応できることを実証する。
論文 参考訳(メタデータ) (2023-06-22T03:44:04Z) - Characterizing Novelty in the Military Domain [0.0]
運用において、リッチな環境は、トレーニングセットやエンジニアリングモデルで説明されていない課題を提示する可能性が高い。
国防高等研究計画局(DARPA)のプログラムは、新規性に堅牢なエージェントの開発を目指している。
この能力は、ミッションクリティカルな環境の中でAIが想定される役割の前に必要となる。
論文 参考訳(メタデータ) (2023-02-23T20:21:24Z) - Towards the Neuroevolution of Low-level Artificial General Intelligence [5.2611228017034435]
我々は、AI(Artificial General Intelligence, AGI)の検索は、人間レベルの知能よりもはるかに低いレベルから始まるべきだと論じる。
我々の仮説は、エージェントが環境の中で行動するとき、学習は感覚フィードバックによって起こるというものである。
環境反応から学習する生物学的にインスパイアされた人工ニューラルネットワークを進化させる手法を評価する。
論文 参考訳(メタデータ) (2022-07-27T15:30:50Z) - The Introspective Agent: Interdependence of Strategy, Physiology, and
Sensing for Embodied Agents [51.94554095091305]
本論では, 環境の文脈において, 自己能力を考慮した内省的エージェントについて論じる。
自然と同じように、私たちは戦略を1つのツールとして再編成して、環境において成功させたいと考えています。
論文 参考訳(メタデータ) (2022-01-02T20:14:01Z) - OPEn: An Open-ended Physics Environment for Learning Without a Task [132.6062618135179]
オープンエンドな物理環境で学んだ世界のモデルが、特定のタスクを伴わずに、下流の物理推論タスクに再利用できるかどうかについて検討する。
我々は,OPEn(Open-ended Physics ENvironment)のベンチマークを構築し,この環境における学習表現をテストするためのいくつかのタスクを明示的に設計する。
その結果、教師なしのコントラスト学習を表現学習に用いたエージェントと、探索のためのインパクト駆動学習が最良の結果となった。
論文 参考訳(メタデータ) (2021-10-13T17:48:23Z) - Phy-Q: A Benchmark for Physical Reasoning [5.45672244836119]
エージェントが物理的シナリオを推論し、それに応じてアクションを取る必要がある新しいベンチマークを提案する。
幼児期に獲得した身体的知識と、ロボットが現実世界で操作するために必要な能力に触発されて、我々は15の不可欠な物理的シナリオを特定した。
各シナリオに対して、さまざまな異なるタスクテンプレートを作成し、同じシナリオ内のすべてのタスクテンプレートを、1つの特定の物理ルールを使用することで解決できるようにします。
論文 参考訳(メタデータ) (2021-08-31T09:11:27Z) - Imitating Interactive Intelligence [24.95842455898523]
仮想環境の簡略化を用いて、人間と自然に相互作用できる人工エージェントの設計方法を検討する。
人間とロバストに相互作用できるエージェントを構築するには、人間と対話しながらトレーニングするのが理想的です。
我々は,人間とエージェントエージェントの対話行動の相違を低減するために,逆強化学習の考え方を用いる。
論文 参考訳(メタデータ) (2020-12-10T13:55:47Z) - ThreeDWorld: A Platform for Interactive Multi-Modal Physical Simulation [75.0278287071591]
ThreeDWorld (TDW) はインタラクティブなマルチモーダル物理シミュレーションのためのプラットフォームである。
TDWは、リッチな3D環境において、高忠実な感覚データのシミュレーションと、移動体エージェントとオブジェクト間の物理的相互作用を可能にする。
我々は、コンピュータビジョン、機械学習、認知科学における新たな研究方向において、TDWによって実現された初期実験を提示する。
論文 参考訳(メタデータ) (2020-07-09T17:33:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。