論文の概要: AndroidEnv: A Reinforcement Learning Platform for Android
- arxiv url: http://arxiv.org/abs/2105.13231v1
- Date: Thu, 27 May 2021 15:20:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-28 16:36:37.525680
- Title: AndroidEnv: A Reinforcement Learning Platform for Android
- Title(参考訳): AndroidEnv: Androidの強化学習プラットフォーム
- Authors: Daniel Toyama, Philippe Hamel, Anita Gergely, Gheorghe Comanici,
Amelia Glaese, Zafarali Ahmed, Tyler Jackson, Shibl Mourad and Doina Precup
- Abstract要約: AndroidEnvは、Androidエコシステム上に構築された強化学習(RL)研究のためのオープンソースプラットフォームである。
RLエージェントは、ユニバーサルタッチスクリーンインターフェースを通じて、人間が一般的に使用するさまざまなアプリやサービスと対話することができる。
エージェントはAndroidデバイスの現実的なシミュレーションを訓練するため、それらは実際のデバイスにデプロイされる可能性がある。
- 参考スコア(独自算出の注目度): 41.572096255032946
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce AndroidEnv, an open-source platform for Reinforcement Learning
(RL) research built on top of the Android ecosystem. AndroidEnv allows RL
agents to interact with a wide variety of apps and services commonly used by
humans through a universal touchscreen interface. Since agents train on a
realistic simulation of an Android device, they have the potential to be
deployed on real devices. In this report, we give an overview of the
environment, highlighting the significant features it provides for research,
and we present an empirical evaluation of some popular reinforcement learning
agents on a set of tasks built on this platform.
- Abstract(参考訳): Androidエコシステム上に構築された強化学習(RL)研究用のオープンソースプラットフォームであるAndroidEnvを紹介する。
AndroidEnvは、RLエージェントがユニバーサルタッチスクリーンインターフェースを通じて、人間が一般的に使用するさまざまなアプリやサービスと対話することを可能にする。
エージェントはandroidデバイスの現実的なシミュレーションをトレーニングするため、実際のデバイスにデプロイされる可能性がある。
本報告では,この環境を概観し,それが研究にもたらす重要な特徴を明らかにするとともに,このプラットフォーム上に構築された一連のタスクに対して,一般的な強化学習エージェントを実証的に評価する。
関連論文リスト
- AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents [32.571194718225996]
我々は,AndroidLabをシステマティックなAndroidエージェントフレームワークとして提案する。
異なるモダリティ、アクションスペース、再現可能なベンチマークを備えた運用環境を含む。
大規模言語モデル(LLM)とマルチモーダルモデル(LMM)の両方を同一のアクション空間でサポートする。
論文 参考訳(メタデータ) (2024-10-31T15:25:20Z) - OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization [66.22117723598872]
マルチモーダルWebエージェントの開発を容易にするために設計されたオープンソースフレームワークを紹介する。
まず、基本モデルを模倣学習で訓練し、基礎能力を得る。
次に、エージェントにオープンウェブを探索させ、その軌道に関するフィードバックを収集する。
論文 参考訳(メタデータ) (2024-10-25T15:01:27Z) - AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents [5.044046039265116]
私たちは、20の現実世界のAndroidアプリに116のプログラムタスクに対して報酬信号を提供する、完全に機能するAndroid環境であるAndroidWorldを紹介します。
静的テストセットを提供する既存のインタラクティブ環境とは異なり、AndroidWorldはパラメータ化され自然言語で表現されるタスクを動的に構築する。
私たちの最高のエージェントは、AndroidWorldのタスクの30.6%を完了できます。
論文 参考訳(メタデータ) (2024-05-23T13:48:54Z) - Aptly: Making Mobile Apps from Natural Language [0.7852714805965528]
Aptlyは、自然言語によるモバイルアプリ開発を可能にするMIT App Inventorプラットフォームの拡張機能である。
本稿は,Aptlyの実践性とユーザエクスペリエンスを考察した,高校生を対象としたパイロット実装に関する考察から結論を得たものである。
論文 参考訳(メタデータ) (2024-04-30T22:33:34Z) - HomeRobot: Open-Vocabulary Mobile Manipulation [107.05702777141178]
Open-Vocabulary Mobile Manipulation (OVMM) は、目に見えない環境で任意のオブジェクトを選択し、命令された場所に配置する問題である。
HomeRobotには2つのコンポーネントがある。シミュレーションコンポーネントは、新しい高品質のマルチルームホーム環境に、大規模で多様なキュレートされたオブジェクトセットを使用する。
論文 参考訳(メタデータ) (2023-06-20T14:30:32Z) - RT-1: Robotics Transformer for Real-World Control at Scale [98.09428483862165]
我々は,有望なスケーラブルなモデル特性を示す,ロボティクストランスフォーマーと呼ばれるモデルクラスを提示する。
実世界の課題を遂行する実ロボットの大規模データ収集に基づいて,様々なモデルクラスと,データサイズ,モデルサイズ,データの多様性の関数として一般化する能力について検証した。
論文 参考訳(メタデータ) (2022-12-13T18:55:15Z) - AppBuddy: Learning to Accomplish Tasks in Mobile Apps via Reinforcement
Learning [19.990946219992992]
モバイルアプリのタスクを学習するためのRLベースのフレームワークを紹介した。
RLエージェントは、オンスクリーン要素の基本的な表現から派生した状態を備える。
我々は,効率的なRLトレーニング環境を実現するために,いくつかの工学的課題に対処するプラットフォームを開発する。
論文 参考訳(メタデータ) (2021-05-31T23:02:38Z) - Robustness of on-device Models: Adversarial Attack to Deep Learning
Models on Android Apps [14.821745719407037]
androidアプリ内のほとんどのディープラーニングモデルは、成熟したリバースエンジニアリングによって容易に得られる。
本研究では,敵対的攻撃を用いた深層学習モデルのハッキングに対して,単純かつ効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2021-01-12T10:49:30Z) - OpenBot: Turning Smartphones into Robots [95.94432031144716]
現在のロボットは高価か、感覚豊かさ、計算能力、通信能力に重大な妥協をもたらす。
我々はスマートフォンを活用して、センサースイート、強力な計算能力、最先端通信チャネル、繁栄するソフトウェアエコシステムへのアクセスなどを備えたロボットを装備することを提案する。
われわれは50ドルの小型電気自動車を設計し、標準のAndroidスマートフォンのロボットボディとして機能する。
論文 参考訳(メタデータ) (2020-08-24T18:04:50Z) - Federated and continual learning for classification tasks in a society
of devices [59.45414406974091]
Light Federated and Continual Consensus (LFedCon2)は、軽量で伝統的な学習者を用いた新しいフェデレーションおよび継続アーキテクチャである。
我々の方法では、スマートフォンやロボットのような無力デバイスが、リアルタイムで、ローカルで、継続的に、自律的に、そしてユーザーから学習することができる。
提案手法をスマートフォン利用者の異種コミュニティに適用し,歩行認識の課題を解決した。
論文 参考訳(メタデータ) (2020-06-12T12:37:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。