論文の概要: OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game
Research
- arxiv url: http://arxiv.org/abs/2012.06168v2
- Date: Sat, 19 Dec 2020 14:23:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 03:07:24.972390
- Title: OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game
Research
- Title(参考訳): OpenHoldem: 大規模不完全な情報ゲーム研究のためのオープンツールキット
- Authors: Kai Li, Hang Xu, Meng Zhang, Enmin Zhao, Zhe Wu, Junliang Xing, Kaiqi
Huang
- Abstract要約: OpenHoldemは、NLTHを用いた大規模不完全情報ゲーム研究のための統合ツールキットです。
1)異なるNLTH AIを徹底的に評価するための標準化された評価プロトコル、2)NLTH AIのための3つの公的に利用可能な強力なベースライン、3)公開NLTH AI評価のための使いやすいAPIを備えたオンラインテストプラットフォーム。
- 参考スコア(独自算出の注目度): 82.09426894653237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Owning to the unremitting efforts by a few institutes, significant progress
has recently been made in designing superhuman AIs in No-limit Texas Hold'em
(NLTH), the primary testbed for large-scale imperfect-information game
research. However, it remains challenging for new researchers to study this
problem since there are no standard benchmarks for comparing with existing
methods, which seriously hinders further developments in this research area. In
this work, we present OpenHoldem, an integrated toolkit for large-scale
imperfect-information game research using NLTH. OpenHoldem makes three main
contributions to this research direction: 1) a standardized evaluation protocol
for thoroughly evaluating different NLTH AIs, 2) three publicly available
strong baselines for NLTH AI, and 3) an online testing platform with
easy-to-use APIs for public NLTH AI evaluation. We have released OpenHoldem at
http://holdem.ia.ac.cn/, hoping it facilitates further studies on the unsolved
theoretical and computational issues in this area and cultivate crucial
research problems like opponent modeling, large-scale equilibrium-finding, and
human-computer interactive learning.
- Abstract(参考訳): 少数の研究所による未許可の努力に則って、大規模不完全情報ゲーム研究の主要な試験場であるNo-Limit Texas Hold'em (NLTH)における超人的AIの設計において、近年大きな進歩が見られた。
しかし、既存の手法と比較するための標準ベンチマークがないため、新しい研究者がこの問題を研究することは依然として困難であり、この研究領域のさらなる発展を著しく妨げている。
本研究では,NLTHを用いた大規模不完全情報ゲーム研究用統合ツールキットOpenHoldemを提案する。
1)異なるnlth aisを徹底的に評価するための標準化された評価プロトコル、2)nlth aiの3つの公に利用可能な強力なベースライン、3)公開nlth ai評価のための使いやすいapiを備えたオンラインテスティングプラットフォーム。
我々はopenholdemをhttp://holdem.ia.ac.cn/でリリースし、この分野における未解決の理論的および計算的問題に関するさらなる研究を促進し、敵モデリング、大規模平衡探索、人間-コンピュータ対話学習といった重要な研究課題を育むことを願っている。
関連論文リスト
- Unveiling the Limits of Learned Local Search Heuristics: Are You the
Mightiest of the Meek? [14.195843311387591]
Tabu Searchに基づく単純な学習は、パフォーマンスと一般化性の点で最先端の学習を超越していることが示される。
今後の研究に向けて,本研究は仮定に挑戦し,エキサイティングな道を開いた。
論文 参考訳(メタデータ) (2023-10-30T20:16:42Z) - A Semi-Automated Solution Approach Selection Tool for Any Use Case via
Scopus and OpenAI: a Case Study for AI/ML in Oncology [0.0]
本稿では,解法レビューと選択のための半自動ツールを提案する。
研究者、実践者、意思決定者を対象とし、将来の作業のベンチマークとして機能する。
論文 参考訳(メタデータ) (2023-07-10T14:07:28Z) - OpenAGI: When LLM Meets Domain Experts [51.86179657467822]
ヒューマン・インテリジェンス(HI)は、複雑なタスクを解くための基本的なスキルの組み合わせに長けている。
この機能は人工知能(AI)にとって不可欠であり、包括的なAIエージェントに組み込まれるべきである。
マルチステップで現実的なタスクを解決するために設計されたオープンソースのプラットフォームであるOpenAGIを紹介します。
論文 参考訳(メタデータ) (2023-04-10T03:55:35Z) - The Role of AI in Drug Discovery: Challenges, Opportunities, and
Strategies [97.5153823429076]
この分野でのAIのメリット、課題、欠点についてレビューする。
データ拡張、説明可能なAIの使用、従来の実験手法とAIの統合についても論じている。
論文 参考訳(メタデータ) (2022-12-08T23:23:39Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - Towards Open Set 3D Learning: A Benchmark on Object Point Clouds [17.145309633743747]
本論文は,オープンセット3次元学習に関する第1報である。
カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。
本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
論文 参考訳(メタデータ) (2022-07-23T17:00:45Z) - Do We Need Another Explainable AI Method? Toward Unifying Post-hoc XAI
Evaluation Methods into an Interactive and Multi-dimensional Benchmark [6.511859672210113]
我々は,xAIアルゴリズムに適用された排他的機能テスト手法を統一するベンチマークであるComparce-xAIを提案する。
このベンチマークは、xAIメソッドを評価する複雑さを3つの階層的なスコアリングにカプセル化する。
インタラクティブなユーザインターフェースは、xAI結果の解釈におけるエラーの軽減に役立つ。
論文 参考訳(メタデータ) (2022-06-08T06:13:39Z) - LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。
我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。
この技術的レポートは、課題のハイライトを要約している。
論文 参考訳(メタデータ) (2020-10-17T13:06:12Z) - Covidex: Neural Ranking Models and Keyword Search Infrastructure for the
COVID-19 Open Research Dataset [87.47567807116204]
Covidexは最新のニューラルランキングモデルを利用する検索エンジンだ。
これは、Allen Institute for AIがキュレートしたCOVID-19 Open Researchデータセットへのアクセスを提供する。
論文 参考訳(メタデータ) (2020-07-14T16:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。