論文の概要: Ludax: A GPU-Accelerated Domain Specific Language for Board Games
- arxiv url: http://arxiv.org/abs/2506.22609v1
- Date: Fri, 27 Jun 2025 20:15:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.48457
- Title: Ludax: A GPU-Accelerated Domain Specific Language for Board Games
- Title(参考訳): Ludax: ボードゲームのためのGPUアクセラレーションされたドメイン固有言語
- Authors: Graham Todd, Alexander G. Padula, Dennis J. N. J. Soemers, Julian Togelius,
- Abstract要約: Ludaxはボードゲーム用のドメイン固有言語で、自動的にハードウェアアクセラレーションされたコードにコンパイルされる。
我々はLudaxを、RLから認知科学まで、ゲーム研究全般を加速させるツールとして想定している。
- 参考スコア(独自算出の注目度): 44.45953630612019
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Games have long been used as benchmarks and testing environments for research in artificial intelligence. A key step in supporting this research was the development of game description languages: frameworks that compile domain-specific code into playable and simulatable game environments, allowing researchers to generalize their algorithms and approaches across multiple games without having to manually implement each one. More recently, progress in reinforcement learning (RL) has been largely driven by advances in hardware acceleration. Libraries like JAX allow practitioners to take full advantage of cutting-edge computing hardware, often speeding up training and testing by orders of magnitude. Here, we present a synthesis of these strands of research: a domain-specific language for board games which automatically compiles into hardware-accelerated code. Our framework, Ludax, combines the generality of game description languages with the speed of modern parallel processing hardware and is designed to fit neatly into existing deep learning pipelines. We envision Ludax as a tool to help accelerate games research generally, from RL to cognitive science, by enabling rapid simulation and providing a flexible representation scheme. We present a detailed breakdown of Ludax's description language and technical notes on the compilation process, along with speed benchmarking and a demonstration of training RL agents. The Ludax framework, along with implementations of existing board games, is open-source and freely available.
- Abstract(参考訳): ゲームは長年、人工知能の研究のためのベンチマークやテスト環境として使われてきた。
この研究をサポートするための重要なステップは、ゲーム記述言語の開発であった: ドメイン固有のコードをプレイ可能でシミュレート可能なゲーム環境にコンパイルするフレームワーク。
近年、強化学習(RL)の進歩は、ハードウェアアクセラレーションの進歩に大きく寄与している。
JAXのようなライブラリは、実践者が最先端のコンピューティングハードウェアを最大限に活用し、トレーニングとテストを桁違いにスピードアップします。
ハードウェアアクセラレーションされたコードに自動的にコンパイルされるボードゲーム用のドメイン固有言語である。
我々のフレームワークであるLudaxは、ゲーム記述言語の汎用性と、現代的な並列処理ハードウェアのスピードを組み合わせることで、既存のディープラーニングパイプラインに適切に適合するように設計されています。
高速シミュレーションとフレキシブルな表現スキームを提供することで,RLから認知科学まで,ゲーム研究全般を加速するツールとしてLudaxを構想する。
本稿では,Ludaxのコンパイルプロセスに関する記述言語と技術ノートの詳細な説明と,速度ベンチマークとRLエージェントの訓練例を紹介する。
Ludaxフレームワークは既存のボードゲームの実装とともにオープンソースであり、無料で利用できる。
関連論文リスト
- Assistax: A Hardware-Accelerated Reinforcement Learning Benchmark for Assistive Robotics [18.70896736010314]
ゲームは、関連する課題を提示し、実行しやすく、理解しやすいため、強化学習ベンチマークを支配しています。
Assistaxは、支援ロボットタスクに起因する課題に対処するために設計されたオープンソースのベンチマークである。
オープンループのウォールタイムに関しては、AsistaxはCPUベースの代替よりもベクタライジングトレーニングの実行が速い場合、最大370タイムで動作します。
論文 参考訳(メタデータ) (2025-07-29T09:49:11Z) - Cross Language Soccer Framework: An Open Source Framework for the RoboCup 2D Soccer Simulation [0.4660328753262075]
RoboCup Soccer Simulation 2D (SS2D) の研究は、Helios、Cyrus、Glidersといった既存のCppベースのコードの複雑さによって妨げられている。
本稿では,ハイパフォーマンスなHeliosベースコードとシームレスに統合する,g-based, language-agnostic frameworkの変換解を提案する。
論文 参考訳(メタデータ) (2024-06-09T03:11:40Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - LuckyMera: a Modular AI Framework for Building Hybrid NetHack Agents [7.23273667916516]
Rogueのようなビデオゲームは、環境の複雑さと計算コストの点で良いトレードオフを提供する。
我々は、NetHackを中心に構築された柔軟性、モジュール化、一般化、AIフレームワークであるLuckyMeraを紹介します。
LuckyMeraには、既製のシンボルモジュールとニューラルモジュール(“スキル”と呼ばれる)のセットが付属している。
論文 参考訳(メタデータ) (2023-07-17T14:46:59Z) - SPRING: Studying the Paper and Reasoning to Play Games [102.5587155284795]
我々は,ゲーム本来の学術論文を読み取るための新しいアプローチ,SPRINGを提案し,大言語モデル(LLM)を通してゲームの説明とプレイの知識を利用する。
実験では,クラフトオープンワールド環境の設定下で,異なる形態のプロンプトによって引き起こされる文脈内「推論」の品質について検討した。
我々の実験は、LLMが一貫したチェーン・オブ・シークレットによって誘導されると、洗練された高レベル軌道の完成に大きな可能性があることを示唆している。
論文 参考訳(メタデータ) (2023-05-24T18:14:35Z) - LOA: Logical Optimal Actions for Text-based Interaction Games [63.003353499732434]
本稿では、強化学習アプリケーションの行動決定アーキテクチャである論理的最適行動(LOA)を提案する。
LOAは、自然言語インタラクションゲームのためのニューラルネットワークとシンボリック知識獲得アプローチの組み合わせである。
論文 参考訳(メタデータ) (2021-10-21T08:36:11Z) - Leveraging Language to Learn Program Abstractions and Search Heuristics [66.28391181268645]
LAPS(Language for Abstraction and Program Search)は、自然言語アノテーションを用いて、ライブラリとニューラルネットワークによる合成のための検索モデルの共同学習をガイドする手法である。
最先端のライブラリ学習システム(DreamCoder)に統合されると、LAPSは高品質なライブラリを生成し、検索効率と一般化を改善する。
論文 参考訳(メタデータ) (2021-06-18T15:08:47Z) - Deep Learning for General Game Playing with Ludii and Polygames [8.752301343910775]
モンテカルロ木探索とディープニューラルネットワークの組み合わせは、多くのボードゲームにおける自動ゲームプレイのための最先端の結果を生み出している。
本論文では,ポリゲームズがルディイを通じて実施・運営されるゲームのモデルをトレーニングし,評価することを可能にする,ルディイとポリゲームズの間の橋渡しの実装について述べる。
論文 参考訳(メタデータ) (2021-01-23T19:08:33Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z) - Efficient Reasoning in Regular Boardgames [2.909363382704072]
本稿では,通常のボードゲーム(RBG)言語における推論の技術的側面について述べる。
RBGは知識推論、分析、生成、学習、ゲームのための一般化されたアルゴリズムの開発を支援する研究ツールとして機能する。
論文 参考訳(メタデータ) (2020-06-15T11:42:08Z) - Lyceum: An efficient and scalable ecosystem for robot learning [11.859894139914754]
Lyceumは、ロボット学習のための高性能な計算エコシステムである。
Julia プログラミング言語と MuJoCo 物理シミュレータ上に構築されている。
OpenAIのGymやDeepMindのdmコントロールなど,一般的な抽象化よりも5~30倍高速です。
論文 参考訳(メタデータ) (2020-01-21T05:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。