Fugu-MT 論文翻訳(概要): OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game Research

論文の概要: OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game Research

arxiv url: http://arxiv.org/abs/2012.06168v2
Date: Sat, 19 Dec 2020 14:23:46 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-11 03:07:24.972390
Title: OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game Research
Title（参考訳）: OpenHoldem: 大規模不完全な情報ゲーム研究のためのオープンツールキット
Authors: Kai Li, Hang Xu, Meng Zhang, Enmin Zhao, Zhe Wu, Junliang Xing, Kaiqi Huang
Abstract要約: OpenHoldemは、NLTHを用いた大規模不完全情報ゲーム研究のための統合ツールキットです。 1)異なるNLTH AIを徹底的に評価するための標準化された評価プロトコル、2)NLTH AIのための3つの公的に利用可能な強力なベースライン、3)公開NLTH AI評価のための使いやすいAPIを備えたオンラインテストプラットフォーム。
参考スコア（独自算出の注目度）: 82.09426894653237
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Owning to the unremitting efforts by a few institutes, significant progress has recently been made in designing superhuman AIs in No-limit Texas Hold'em (NLTH), the primary testbed for large-scale imperfect-information game research. However, it remains challenging for new researchers to study this problem since there are no standard benchmarks for comparing with existing methods, which seriously hinders further developments in this research area. In this work, we present OpenHoldem, an integrated toolkit for large-scale imperfect-information game research using NLTH. OpenHoldem makes three main contributions to this research direction: 1) a standardized evaluation protocol for thoroughly evaluating different NLTH AIs, 2) three publicly available strong baselines for NLTH AI, and 3) an online testing platform with easy-to-use APIs for public NLTH AI evaluation. We have released OpenHoldem at http://holdem.ia.ac.cn/, hoping it facilitates further studies on the unsolved theoretical and computational issues in this area and cultivate crucial research problems like opponent modeling, large-scale equilibrium-finding, and human-computer interactive learning.
Abstract（参考訳）: 少数の研究所による未許可の努力に則って、大規模不完全情報ゲーム研究の主要な試験場であるNo-Limit Texas Hold'em (NLTH)における超人的AIの設計において、近年大きな進歩が見られた。しかし、既存の手法と比較するための標準ベンチマークがないため、新しい研究者がこの問題を研究することは依然として困難であり、この研究領域のさらなる発展を著しく妨げている。本研究では,NLTHを用いた大規模不完全情報ゲーム研究用統合ツールキットOpenHoldemを提案する。 1)異なるnlth aisを徹底的に評価するための標準化された評価プロトコル、2)nlth aiの3つの公に利用可能な強力なベースライン、3)公開nlth ai評価のための使いやすいapiを備えたオンラインテスティングプラットフォーム。我々はopenholdemをhttp://holdem.ia.ac.cn/でリリースし、この分野における未解決の理論的および計算的問題に関するさらなる研究を促進し、敵モデリング、大規模平衡探索、人間-コンピュータ対話学習といった重要な研究課題を育むことを願っている。

関連論文リスト

OpenGuanDan: A Large-Scale Imperfect Information Game Benchmark [31.554414017099102]
OpenGuanDanは、GuanDanの効率的なシミュレーションと、学習ベースのAIエージェントとルールベースのAIエージェントの包括的な評価を可能にする、新しいベンチマークである。 OpenGuanDanは、不完全な情報、大規模な情報セットとアクションスペース、協力と競争を含む混合学習目標、長期的な意思決定、可変アクションスペース、動的チーム構成など、多くの非自明な課題を提起している。我々は,(1)グアンダンのAIエージェント間のペアワイズ競争,(2)人間とAIのマッチングの2種類の評価を行う。
論文参考訳（メタデータ） (2026-01-31T11:46:29Z)
The Role of AI in Modern Penetration Testing [0.0]
侵入テストはサイバーセキュリティの基礎であり、伝統的に手動の時間集約的なプロセスによって駆動される。この体系的な文献レビューは、人工知能(AI)が浸透試験をどう変えているかを検証している。
論文参考訳（メタデータ） (2025-12-13T13:34:31Z)
LibEMER: A novel benchmark and algorithms library for EEG-based Multimodal Emotion Recognition [10.351828466151057]
我々は、キュレートされたディープラーニング手法の完全な再現可能なPyTorch実装を提供する統合評価フレームワークLibEMERを紹介する。このフレームワークは、2つの学習タスクにまたがる3つの広く使用されている公開データセットに対して、バイアスのないパフォーマンスアセスメントを可能にする。
論文参考訳（メタデータ） (2025-09-14T03:50:07Z)
FormulaOne: Measuring the Depth of Algorithmic Reasoning Beyond Competitive Programming [19.576944188747166]
FormulaOne(フォーミュラワン)は、グラフ理論、論理、アルゴリズムのベンチマークである。私たちの問題は非常に要求に富んでおり、いくつかの推論ステップを必要としています。注目すべきは、OpenAIのo3のような最先端のモデルはF1で完全に失敗することです。
論文参考訳（メタデータ） (2025-07-17T17:53:55Z)
Theoretical Physics Benchmark (TPBench) -- a Dataset and Study of AI Reasoning Capabilities in Theoretical Physics [13.530403536762064]
我々は、高エネルギー理論と宇宙論に焦点をあて、理論物理学における問題を解決するAIの能力を評価するためのベンチマークを導入する。ベンチマークの最初のイテレーションは、学部レベルから研究レベルまで、難易度が異なる57の問題で構成されています。我々は、o3-mini、o1、DeepSeek-R1、GPT-4o、LlamaとQwenのバージョンなど、オープンでクローズドな言語モデルでデータセットを評価した。
論文参考訳（メタデータ） (2025-02-19T19:00:00Z)
CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings [70.95565672516979]
LiveCodeBenchやUSACOといった既存のベンチマークは、プライベートテストケースの可用性の欠如、特別な審査員のサポートの欠如、不整合実行環境のために不足している。 CodeEloは標準化された競合レベルのコード生成ベンチマークで、これらすべての課題に初めて効果的に対処する。
論文参考訳（メタデータ） (2025-01-02T13:49:00Z)
Artificial Intelligence of Things: A Survey [14.204632921719933]
IoT(Internet of Things)とAI(Modern Artificial Intelligence)の統合により、AIoT(Artificial Intelligence of Things)と呼ばれる新しいパラダイムが生まれました。我々は,センサ,コンピューティング,ネットワークおよび通信に関連するAIoT文献について検討する。これらの分野での進歩に加えて、さまざまな重要なアプリケーションドメイン用に設計されたドメイン固有のAIoTシステムについてもレビューする。
論文参考訳（メタデータ） (2024-10-25T22:45:58Z)
O1 Replication Journey: A Strategic Progress Report -- Part 1 [52.062216849476776]
本稿では,O1 Replication Journeyに具体化された人工知能研究の先駆的アプローチを紹介する。我々の方法論は、長期化したチームベースのプロジェクトの不規則性を含む、現代のAI研究における重要な課題に対処する。本稿では,モデルにショートカットだけでなく,完全な探索プロセスの学習を促す旅行学習パラダイムを提案する。
論文参考訳（メタデータ） (2024-10-08T15:13:01Z)
A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文参考訳（メタデータ） (2024-05-30T04:46:40Z)
Quantitative Analysis of AI-Generated Texts in Academic Research: A Study of AI Presence in Arxiv Submissions using AI Detection Tool [0.0]
本研究は,学術機関がArxivに投稿するために用いた,意図的に制作されたコンテンツを閲覧する手法について分析する。統計分析によると、Originality.aiは98%の精度で正確である。
論文参考訳（メタデータ） (2024-02-09T17:20:48Z)
How do machines learn? Evaluating the AIcon2abs method [0.0]
本研究は,AIcon2abs法(コンクリートから抽象へのAI:人工知能を一般大衆に普及させるAI)の評価を目的とした先行研究の拡大である。このアプローチでは、単純さとユーザアクセシビリティで知られている、ウェイトレスニューラルネットワークであるWiSARDアルゴリズムを採用している。 WiSARDはインターネットを必要とせず、技術的でないユーザーやリソースに制限のある環境に最適である。
論文参考訳（メタデータ） (2024-01-14T22:40:58Z)
Unveiling the Limits of Learned Local Search Heuristics: Are You the Mightiest of the Meek? [14.195843311387591]
Tabu Searchに基づく単純な学習は、パフォーマンスと一般化性の点で最先端の学習を超越していることが示される。今後の研究に向けて,本研究は仮定に挑戦し,エキサイティングな道を開いた。
論文参考訳（メタデータ） (2023-10-30T20:16:42Z)
A Semi-Automated Solution Approach Recommender for a Given Use Case: a Case Study for AI/ML in Oncology via Scopus and OpenAI [0.6749750044497732]
提案するツールであるSARBOLD-LLMは,与えられた問題に関連するメソッドの発見と選択を可能にする。意思決定の洞察を導き出すために、文学における彼らの使用に関する追加情報を提供する。調査を最初に行う方法を選択し、調査を補完する上で有用なツールである。
論文参考訳（メタデータ） (2023-07-10T14:07:28Z)
OpenAGI: When LLM Meets Domain Experts [51.86179657467822]
ヒューマン・インテリジェンス(HI)は、複雑なタスクを解くための基本的なスキルの組み合わせに長けている。この機能は人工知能(AI)にとって不可欠であり、包括的なAIエージェントに組み込まれるべきである。マルチステップで現実的なタスクを解決するために設計されたオープンソースのプラットフォームであるOpenAGIを紹介します。
論文参考訳（メタデータ） (2023-04-10T03:55:35Z)
Do We Need Another Explainable AI Method? Toward Unifying Post-hoc XAI Evaluation Methods into an Interactive and Multi-dimensional Benchmark [6.511859672210113]
我々は,xAIアルゴリズムに適用された排他的機能テスト手法を統一するベンチマークであるComparce-xAIを提案する。このベンチマークは、xAIメソッドを評価する複雑さを3つの階層的なスコアリングにカプセル化する。インタラクティブなユーザインターフェースは、xAI結果の解釈におけるエラーの軽減に役立つ。
論文参考訳（メタデータ） (2022-06-08T06:13:39Z)
LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。この技術的レポートは、課題のハイライトを要約している。
論文参考訳（メタデータ） (2020-10-17T13:06:12Z)
Covidex: Neural Ranking Models and Keyword Search Infrastructure for the COVID-19 Open Research Dataset [87.47567807116204]
Covidexは最新のニューラルランキングモデルを利用する検索エンジンだ。これは、Allen Institute for AIがキュレートしたCOVID-19 Open Researchデータセットへのアクセスを提供する。
論文参考訳（メタデータ） (2020-07-14T16:26:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。