論文の概要: EconoJax: A Fast & Scalable Economic Simulation in Jax
- arxiv url: http://arxiv.org/abs/2410.22165v1
- Date: Tue, 29 Oct 2024 16:02:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 17:07:41.918997
- Title: EconoJax: A Fast & Scalable Economic Simulation in Jax
- Title(参考訳): EconoJax: Jaxの高速でスケーラブルな経済シミュレーション
- Authors: Koen Ponse, Aske Plaat, Niki van Stein, Thomas M. Moerland,
- Abstract要約: 本稿では,AI経済学に基づく高速シミュレーション経済であるEconoJaxを紹介する。
EconoJaxとそのトレーニングパイプラインは完全にJAXで書かれています。
実世界の経済行動が15分以内のトレーニングによってどのように現れるかを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate economic simulations often require many experimental runs, particularly when combined with reinforcement learning. Unfortunately, training reinforcement learning agents in multi-agent economic environments can be slow. This paper introduces EconoJax, a fast simulated economy, based on the AI economist. EconoJax, and its training pipeline, are completely written in JAX. This allows EconoJax to scale to large population sizes and perform large experiments, while keeping training times within minutes. Through experiments with populations of 100 agents, we show how real-world economic behavior emerges through training within 15 minutes, in contrast to previous work that required several days. To aid and inspire researchers to build more rich and dynamic economic simulations, we open-source EconoJax on Github at: https://github.com/ponseko/econojax.
- Abstract(参考訳): 正確な経済シミュレーションは、特に強化学習と組み合わせた場合、多くの実験的な実行を必要とすることが多い。
残念ながら、マルチエージェント経済環境における強化学習エージェントの訓練は遅くなる可能性がある。
本稿では,AI経済学に基づく高速シミュレーション経済であるEconoJaxを紹介する。
EconoJaxとそのトレーニングパイプラインは、完全にJAXで書かれています。
これにより、EconoJaxは大規模な人口に拡大し、数分以内にトレーニング時間を維持しながら大規模な実験を行うことができる。
100人のエージェントによる実験を通して、15分以内のトレーニングによって現実の経済行動が出現することを示す。
研究者がよりリッチでダイナミックな経済シミュレーションを構築するのを助けるために、私たちはGithubでEconoJaxをオープンソースにしました。
関連論文リスト
- Behavioral Exploration: Learning to Explore via In-Context Adaptation [53.92981562916783]
我々は、過去の観察の文脈で条件付けられた専門家の行動を予測し、専門家の行動がこの文脈とどのように関係しているかを測定するために、長期コンテキスト生成モデルを訓練する。
これにより、モデルが専門家の振る舞いを模倣するだけでなく、過去の相互作用の歴史を文脈に反映することで、これまで選択されたものと異なる専門家の振る舞いを選択することができる。
本手法は実環境におけるロボット操作作業だけでなく,シミュレーションロコモーションと操作設定の両方において有効であることを示す。
論文 参考訳(メタデータ) (2025-07-11T21:36:19Z) - From Reproduction to Replication: Evaluating Research Agents with Progressive Code Masking [48.90371827091671]
AutoExperimentは、AIエージェントの機械学習実験の実装と実行能力を評価するベンチマークである。
我々は最先端のエージェントを評価し、n$が増加するにつれて性能が急速に低下することを発見した。
本研究は、長期コード生成、文脈検索、自律的な実験実行における重要な課題を浮き彫りにした。
論文 参考訳(メタデータ) (2025-06-24T15:39:20Z) - EconGym: A Scalable AI Testbed with Diverse Economic Tasks [14.392383131881877]
EconGymは、多様な経済タスクとAIアルゴリズムを結びつけるスケーラブルなテストベッドです。
ユーザは多様なエージェントアルゴリズムで経済的役割を柔軟に構成し、リッチなマルチエージェントトラジェクトリをシミュレートすることができる。
その結果、よりリッチなタスク構成とアルゴリズムの多様性がポリシー空間を広げていることが示唆された。
論文 参考訳(メタデータ) (2025-06-13T09:35:04Z) - Occult: Optimizing Collaborative Communication across Experts for Accelerated Parallel MoE Training and Inference [77.07591324890537]
通信コストを削減するために,システムレベルのイノベーションとアルゴリズムレベルのイノベーションを提案する。
共同作業の比率を増大させることで,専門家の並列化を促進できることを示す。
私たちの設計では、通信コストを削減した正確な結果を提供するか、コラボレーションプルーニングによるコストを最小限に抑えるかのどちらかが可能です。
論文 参考訳(メタデータ) (2025-05-19T16:50:27Z) - SIME: Enhancing Policy Self-Improvement with Modal-level Exploration [49.86173021151849]
自己改善を成功させる鍵は、モーダルレベルの探索とデータ選択である。
ポリシー実行中にモーダルレベルの探索機構を組み込むことで、ロボットはより多様なマルチモーダルインタラクションを生成できる。
シミュレーションベンチマークと実世界実験の両方において,効果的なロボット自己改善の実証に成功した。
論文 参考訳(メタデータ) (2025-05-02T17:13:03Z) - JaxLife: An Open-Ended Agentic Simulator [3.479490713357225]
我々は、深層ニューラルネットワークによってパラメータ化されたエンボディエージェントが生き残ることを学ばなければならない人工生命シミュレータJaxLifeを提示する。
まず、環境を記述し、有意義なチューリング完全計算を実現できることを示す。
次に、初歩的なコミュニケーションプロトコル、農業、ツール利用など、進化した創発的エージェントの行動を分析する。
論文 参考訳(メタデータ) (2024-09-01T22:05:02Z) - An Economic Framework for 6-DoF Grasp Detection [28.25609101289935]
本研究では,訓練における資源コストの低減と効果的な把握性能の維持を目的とした,6-DoFグリップ検出のための経済的な枠組みを提案する。
EconomicGrasp は SOTA の把握法を平均 3AP で上回り,資源コストが極端に低い。
論文 参考訳(メタデータ) (2024-07-11T10:19:48Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Sim-and-Real Reinforcement Learning for Manipulation: A Consensus-based
Approach [4.684126055213616]
マニピュレータのピック・アンド・プレイスタスクのための,コンセンサスに基づくCSAR(Sim-And-Real Deep reinforcement Learning)アルゴリズムを提案する。
我々はシミュレーターと実世界のエージェントを訓練し、シミュレートと実世界の両方の最適なポリシーを得る。
論文 参考訳(メタデータ) (2023-02-26T22:27:23Z) - Simulation-Based Parallel Training [55.41644538483948]
このようなボトルネックを緩和するトレーニングフレームワークを設計するために、現在進行中の作業を紹介します。
トレーニングプロセスと並行してデータを生成する。
このバイアスをメモリバッファで軽減する戦略を提案する。
論文 参考訳(メタデータ) (2022-11-08T09:31:25Z) - Parallel Reinforcement Learning Simulation for Visual Quadrotor
Navigation [4.597465975849579]
強化学習(Reinforcement Learning、RL)は、ロボットに物理的な世界の中をナビゲートするように教えるエージェントベースのアプローチである。
本稿では,AirSim上に構築された並列学習を効率的に行うシミュレーションフレームワークを提案する。
このフレームワーク上に構築されたApe-Xは、AirSim環境の分散トレーニングを組み込むように修正されている。
論文 参考訳(メタデータ) (2022-09-22T15:27:42Z) - Finding General Equilibria in Many-Agent Economic Simulations Using Deep
Reinforcement Learning [72.23843557783533]
本研究では,エージェント種別のメタゲームに対して,エプシロン・ナッシュ平衡である安定解を求めることができることを示す。
私たちのアプローチはより柔軟で、例えば市場クリア化のような非現実的な仮定は必要ありません。
当社のアプローチは、実際のビジネスサイクルモデル、DGEモデルの代表的なファミリー、100人の労働者消費者、10社の企業、税金と再分配を行う政府で実証しています。
論文 参考訳(メタデータ) (2022-01-03T17:00:17Z) - Towards Continuous Compounding Effects and Agile Practices in
Educational Experimentation [2.7094829962573304]
本稿では,異なる実験過程を分類する枠組みを定義する。
次世代の教育技術の成功は、プロセスの完全な集合を取り入れることによって後押しされる。
論文 参考訳(メタデータ) (2021-11-17T13:10:51Z) - The AI Economist: Optimal Economic Policy Design via Two-level Deep
Reinforcement Learning [126.37520136341094]
機械学習に基づく経済シミュレーションは強力な政策・メカニズム設計の枠組みであることを示す。
AIエコノミスト(AI Economist)は、エージェントと共同適応するソーシャルプランナーの両方を訓練する2段階のディープRLフレームワークである。
単純な一段階の経済では、AIエコノミストは経済理論の最適税制を回復する。
論文 参考訳(メタデータ) (2021-08-05T17:42:35Z) - Reactive Long Horizon Task Execution via Visual Skill and Precondition
Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。
シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文 参考訳(メタデータ) (2020-11-17T15:24:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。