論文の概要: Forecasting Evolution of Clusters in StarCraft II with Hebbian Learning
- arxiv url: http://arxiv.org/abs/2209.06904v1
- Date: Fri, 19 Aug 2022 16:13:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-18 17:00:38.087539
- Title: Forecasting Evolution of Clusters in StarCraft II with Hebbian Learning
- Title(参考訳): ヘビアン学習によるStarCraft IIクラスタの予測進化
- Authors: Beomseok Kang, Saibal Mukhopadhyay
- Abstract要約: スタークラフトIIにおけるエージェントのクラスタリングは様々な目的で研究されている。
クラスタの進化を予測するために、教師なし学習と自己教師付き学習を結合したハイブリッドAIモデルを提案する。
提案手法は,クラスタ・セントロイドとその半径に関して,クラスタの複雑な進化を予測する。
- 参考スコア(独自算出の注目度): 10.983063391496543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tactics in StarCraft II are closely related to group behavior of the game
agents. In other words, human players in the game often group spatially near
agents into a team and control the team to defeat opponents. In this light,
clustering the agents in StarCraft II has been studied for various purposes
such as the efficient control of the agents in multi-agent reinforcement
learning and game analytic tools for the game users. However, these works do
not aim to learn and predict dynamics of the clusters, limiting the
applications to currently observed game status. In this paper, we present a
hybrid AI model that couples unsupervised and self-supervised learning to
forecast evolution of the clusters in StarCraft II. We develop an unsupervised
Hebbian learning method in a set-to-cluster module to efficiently create a
variable number of the clusters, and it also features lower inference time
complexity than conventional k-means clustering. For the prediction task, a
long short-term memory based prediction module is designed to recursively
forecast state vectors generated by the set-to-cluster module. We observe the
proposed model successfully predicts complex evolution of the clusters with
regard to cluster centroids and their radii.
- Abstract(参考訳): StarCraft IIの戦術はゲームエージェントの集団行動と密接に関連している。
言い換えれば、ゲームの人間プレイヤーは、しばしばエージェントの近くに空間的にグループ化され、相手を倒すためにチームを制御する。
この光の中では,多エージェント強化学習におけるエージェントの効率的な制御やゲームユーザのためのゲーム解析ツールなど,さまざまな目的で,StarCraft IIにおけるエージェントのクラスタリングが研究されている。
しかし、これらの作品はクラスタのダイナミクスを学習し予測することを目的としておらず、アプリケーションは現在観察されているゲームステータスに制限されている。
本稿では,StarCraft IIにおけるクラスタの進化を予測するために,教師なし学習と自己教師付き学習を組み合わせたハイブリッドAIモデルを提案する。
本研究では,クラスタの可変数を効率的に生成するために,クラスタモジュールに教師なしのヘビー学習法を開発し,従来のk-meansクラスタリングよりも推論時間の複雑さを低減した。
予測タスクのために、長い短期記憶ベースの予測モジュールは、設定からクラスタまでのモジュールによって生成された状態ベクトルを再帰的に予測するように設計されている。
提案モデルでは,クラスター中心核とその半径に関して,クラスターの複雑な進化をうまく予測できた。
関連論文リスト
- CODEX: A Cluster-Based Method for Explainable Reinforcement Learning [0.0]
本稿では,状態-作用空間におけるRLエージェントの挙動を効果的に要約できる意味的クラスタリングを取り入れた手法を提案する。
MiniGridとStarCraft IIのゲーム環境での実験では、セマンティッククラスタは時間的およびエンティティ情報を保持する。
論文 参考訳(メタデータ) (2023-12-07T11:04:37Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Large Language Models Enable Few-Shot Clustering [88.06276828752553]
大規模言語モデルは、クエリ効率が良く、数発のセミ教師付きテキストクラスタリングを可能にするために、専門家のガイダンスを増幅できることを示す。
最初の2つのステージにLSMを組み込むことで、クラスタの品質が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-07-02T09:17:11Z) - Deep Temporal Contrastive Clustering [21.660509622172274]
本稿では,時間差の深いクラスタリング手法を提案する。
対照的な学習パラダイムを、ディープ時系列クラスタリング研究に取り入れている。
様々な時系列データセットの実験は、最先端技術に対する我々のアプローチの優位性を実証している。
論文 参考訳(メタデータ) (2022-12-29T16:43:34Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Mind Your Clever Neighbours: Unsupervised Person Re-identification via
Adaptive Clustering Relationship Modeling [19.532602887109668]
教師なし人物再識別(Re-ID)は、教師付きRe-IDモデルのスケーラビリティ問題を解決する可能性から注目されている。
既存の教師なし手法の多くは反復的なクラスタリング機構を採用しており、教師なしクラスタリングによって生成された擬似ラベルに基づいてネットワークを訓練している。
高品質な擬似ラベルを生成し,クラスタリングエラーの影響を軽減するために,教師なしのRe-IDのための新しいクラスタリング関係モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T10:55:07Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Dynamic Clustering in Federated Learning [15.37652170495055]
本稿では,生成型逆ネットワーク型クラスタリング,クラスタキャリブレーション,クラスタ分割という3相データクラスタリングアルゴリズムを提案する。
提案アルゴリズムは,セルラーネットワークハンドオーバを含む予測モデルの性能を43%向上させる。
論文 参考訳(メタデータ) (2020-12-07T15:30:07Z) - Consensus Clustering With Unsupervised Representation Learning [4.164845768197489]
我々はBootstrap Your Own Latent(BYOL)のクラスタリング能力について検討し、BYOLを使って学習した機能がクラスタリングに最適でないことを観察する。
本稿では,新たなコンセンサスクラスタリングに基づく損失関数を提案するとともに,クラスタリング能力を改善し,類似のクラスタリングに基づく手法より優れたBYOLをエンド・ツー・エンドで学習する。
論文 参考訳(メタデータ) (2020-10-03T01:16:46Z) - Online Deep Clustering for Unsupervised Representation Learning [108.33534231219464]
オンラインディープクラスタリング(ODC)は、交互にではなく、クラスタリングとネットワーク更新を同時に実行する。
我々は,2つの動的メモリモジュール,すなわち,サンプルラベルと特徴を格納するサンプルメモリと,セントロイド進化のためのセントロイドメモリを設計,維持する。
このように、ラベルとネットワークは交互にではなく肩から肩へと進化する。
論文 参考訳(メタデータ) (2020-06-18T16:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。