論文の概要: MSC: A Dataset for Macro-Management in StarCraft II
- arxiv url: http://arxiv.org/abs/1710.03131v3
- Date: Mon, 3 Apr 2023 11:56:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 02:41:44.999246
- Title: MSC: A Dataset for Macro-Management in StarCraft II
- Title(参考訳): MSC: StarCraft IIのマクロ管理のためのデータセット
- Authors: Huikai Wu, Yanqi Zong, Junge Zhang, Kaiqi Huang
- Abstract要約: プラットフォームSC2LEに基づいた新しいマクロ管理データセットをリリースする。
MSCは、よく設計された特徴ベクトル、事前定義されたハイレベルアクション、および各マッチの最終結果からなる。
データセットの他に,グローバルな状態評価とビルド順序予測のためのベースラインモデルと初期ベースライン結果を提案する。
- 参考スコア(独自算出の注目度): 52.52008929278214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Macro-management is an important problem in StarCraft, which has been studied
for a long time. Various datasets together with assorted methods have been
proposed in the last few years. But these datasets have some defects for
boosting the academic and industrial research: 1) There're neither standard
preprocessing, parsing and feature extraction procedures nor predefined
training, validation and test set in some datasets. 2) Some datasets are only
specified for certain tasks in macro-management. 3) Some datasets are either
too small or don't have enough labeled data for modern machine learning
algorithms such as deep neural networks. So most previous methods are trained
with various features, evaluated on different test sets from the same or
different datasets, making it difficult to be compared directly. To boost the
research of macro-management in StarCraft, we release a new dataset MSC based
on the platform SC2LE. MSC consists of well-designed feature vectors,
pre-defined high-level actions and final result of each match. We also split
MSC into training, validation and test set for the convenience of evaluation
and comparison. Besides the dataset, we propose a baseline model and present
initial baseline results for global state evaluation and build order
prediction, which are two of the key tasks in macro-management. Various
downstream tasks and analyses of the dataset are also described for the sake of
research on macro-management in StarCraft II. Homepage:
https://github.com/wuhuikai/MSC.
- Abstract(参考訳): マクロ管理はstarcraftの重要な問題であり、長い間研究されてきた。
さまざまなデータセットとさまざまなメソッドがここ数年で提案されている。
しかしこれらのデータセットには、学術研究や産業研究の促進にいくつかの欠陥がある。
1) 標準的な事前処理、解析、機能抽出の手順も、いくつかのデータセットで事前に定義されたトレーニング、検証、テストセットもない。
2)いくつかのデータセットはマクロ管理の特定のタスクに対してのみ指定される。
3) 一部のデータセットは小さすぎるか、ディープニューラルネットワークのような現代の機械学習アルゴリズムに十分なラベル付きデータを持っていない。
したがって、以前のほとんどのメソッドはさまざまな機能でトレーニングされ、同じまたは異なるデータセットの異なるテストセットで評価されるため、直接比較することが困難になる。
StarCraftにおけるマクロ管理の研究を促進するため、SC2LEプラットフォームに基づく新しいデータセットMSCをリリースする。
mscはよく設計された特徴ベクトル、事前定義されたハイレベルアクション、各マッチの最終結果で構成される。
また,MSCをトレーニング,検証,テストセットに分割し,評価と比較の便宜を図る。
データセットの他に,グローバル状態評価とビルド順序予測のためのベースラインモデルと最初のベースライン結果を提案し,マクロ管理における2つの重要なタスクである。
また、StarCraft IIにおけるマクロ管理の研究のために、さまざまな下流タスクやデータセットの分析も記述されている。
ホームページ:https://github.com/wuhuikai/MSC
関連論文リスト
- SEART Data Hub: Streamlining Large-Scale Source Code Mining and Pre-Processing [13.717170962455526]
私たちはSEART Data HubというWebアプリケーションを紹介します。これは、公開GitHubリポジトリからマイニングされたコードを特徴とする大規模データセットを簡単に構築し、事前処理できるWebアプリケーションです。
簡単なWebインターフェースを通じて、研究者はマイニング基準と、実行したい特定の前処理ステップを指定できる。
リクエストを提出すると、ユーザは数時間以内に、必要なデータセットのダウンロードリンク付きのメールを受け取る。
論文 参考訳(メタデータ) (2024-09-27T11:42:19Z) - Training on the Benchmark Is Not All You Need [52.01920740114261]
本稿では,複数選択肢の内容に基づいた簡易かつ効果的なデータ漏洩検出手法を提案する。
本手法は,モデルトレーニングデータや重みを使用せずに,ブラックボックス条件下で動作することができる。
我々は,4つのベンチマークデータセットを用いて,31個の主要なオープンソースLCMのデータ漏洩の程度を評価する。
論文 参考訳(メタデータ) (2024-09-03T11:09:44Z) - FungiTastic: A multi-modal dataset and benchmark for image categorization [21.01939456569417]
我々は,20年間にわたって連続的に収集された菌類記録に基づいて,新しいベンチマークとデータセットFungiTasticを導入する。
データセットは専門家によってラベル付けされ、キュレーションされ、5kの細粒度カテゴリー(種)の約350kのマルチモーダル観測で構成されている。
FungiTasticは、前例のないラベルの信頼性に関するDNA配列の真実をテストセットを含む数少ないベンチマークの1つである。
論文 参考訳(メタデータ) (2024-08-24T17:22:46Z) - Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach [36.47860223750303]
自己教師付き事前学習のための高品質データセットの自動キュレーションの問題点を考察する。
これらの基準をすべて満たしたクラスタリングに基づく手法を提案する。
我々の方法は、大規模で多様なデータリポジトリ上で、$k$-meansの連続的かつ階層的なアプリケーションを含む。
論文 参考訳(メタデータ) (2024-05-24T14:58:51Z) - On Inter-dataset Code Duplication and Data Leakage in Large Language Models [4.148857672591562]
本稿では,データセット間の重複現象とその大規模言語モデル(LLM)評価への影響について検討する。
この結果から,複数のSEタスクにまたがるLCMの評価は,データ間重複現象に起因する可能性が示唆された。
オープンソースモデルがデータセット間の重複に影響される可能性があることを示す。
論文 参考訳(メタデータ) (2024-01-15T19:46:40Z) - DataComp: In search of the next generation of multimodal datasets [179.79323076587255]
DataCompは、Common Crawlの128億の画像テキストペアの候補プールを中心にしたデータセット実験用のテストベッドである。
我々のベンチマークは、複数の計算スケールから成っている。
特に、最良のベースラインであるDataComp-1Bは、ImageNetでCLIP ViT-L/14をスクラッチから79.2%のゼロショット精度でトレーニングすることが可能です。
論文 参考訳(メタデータ) (2023-04-27T11:37:18Z) - Mixing Deep Learning and Multiple Criteria Optimization: An Application
to Distributed Learning with Multiple Datasets [0.0]
トレーニングフェーズは、マシンラーニングプロセスにおいて最も重要なステージです。
本研究では,特定の入力とラベルに関連付けられた出力との距離を基準として,複数の基準最適化モデルを構築した。
MNISTデータを用いた数値分類において,このモデルと数値実験を実現するためのスカラー化手法を提案する。
論文 参考訳(メタデータ) (2021-12-02T16:00:44Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。