論文の概要: Forecasting Evolution of Clusters in Game Agents with Hebbian Learning
- arxiv url: http://arxiv.org/abs/2209.06904v2
- Date: Wed, 31 May 2023 04:25:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 20:43:17.073624
- Title: Forecasting Evolution of Clusters in Game Agents with Hebbian Learning
- Title(参考訳): ヘビー学習を伴うゲームエージェントにおけるクラスターの進化予測
- Authors: Beomseok Kang, Saibal Mukhopadhyay
- Abstract要約: 本稿では,スタークラフトIIにおけるクラスタの進化を予測するために,教師なし学習と自己教師付き学習を結合したハイブリッドAIモデルを提案する。
提案モデルを用いて,ゲーム内のクラスタの複雑な動きを予測する実験を行った。
- 参考スコア(独自算出の注目度): 10.983063391496543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large multi-agent systems such as real-time strategy games are often driven
by collective behavior of agents. For example, in StarCraft II, human players
group spatially near agents into a team and control the team to defeat
opponents. In this light, clustering the agents in the game has been used for
various purposes such as the efficient control of the agents in multi-agent
reinforcement learning and game analytic tools for the game users. However,
despite the useful information provided by clustering, learning the dynamics of
multi-agent systems at a cluster level has been rarely studied yet. In this
paper, we present a hybrid AI model that couples unsupervised and
self-supervised learning to forecast evolution of the clusters in StarCraft II.
We develop an unsupervised Hebbian learning method in a set-to-cluster module
to efficiently create a variable number of the clusters with lower inference
time complexity than K-means clustering. Also, a long short-term memory based
prediction module is designed to recursively forecast state vectors generated
by the set-to-cluster module to define cluster configuration. We experimentally
demonstrate the proposed model successfully predicts complex movement of the
clusters in the game.
- Abstract(参考訳): リアルタイム戦略ゲームのような大規模マルチエージェントシステムはエージェントの集団行動によって駆動されることが多い。
例えば、StarCraft IIでは、人間のプレイヤーがエージェントの近くに空間的にグループ化され、相手を倒すためにチームを制御する。
この光では,エージェントのクラスタリングが多エージェント強化学習におけるエージェントの効率的な制御やゲームユーザのためのゲーム分析ツールなど,さまざまな目的で使用されている。
しかし,クラスタリングによって提供される有用な情報にもかかわらず,クラスタレベルでのマルチエージェントシステムのダイナミクスの学習はめったに行われていない。
本稿では,StarCraft IIにおけるクラスタの進化を予測するために,教師なし学習と自己教師付き学習を組み合わせたハイブリッドAIモデルを提案する。
本研究では,クラスタ間モジュールに教師なしのヘビー学習法を開発し,k平均クラスタリングよりも推論時間の複雑度が低いクラスタの可変数を効率的に生成する。
また、長期間のメモリベースの予測モジュールは、クラスタ構成を定義するためにset-to-clusterモジュールによって生成された状態ベクトルを再帰的に予測するように設計されている。
提案モデルを用いて,ゲーム内のクラスタの複雑な動きを予測する実験を行った。
関連論文リスト
- CODEX: A Cluster-Based Method for Explainable Reinforcement Learning [0.0]
本稿では,状態-作用空間におけるRLエージェントの挙動を効果的に要約できる意味的クラスタリングを取り入れた手法を提案する。
MiniGridとStarCraft IIのゲーム環境での実験では、セマンティッククラスタは時間的およびエンティティ情報を保持する。
論文 参考訳(メタデータ) (2023-12-07T11:04:37Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Large Language Models Enable Few-Shot Clustering [88.06276828752553]
大規模言語モデルは、クエリ効率が良く、数発のセミ教師付きテキストクラスタリングを可能にするために、専門家のガイダンスを増幅できることを示す。
最初の2つのステージにLSMを組み込むことで、クラスタの品質が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-07-02T09:17:11Z) - Deep Temporal Contrastive Clustering [21.660509622172274]
本稿では,時間差の深いクラスタリング手法を提案する。
対照的な学習パラダイムを、ディープ時系列クラスタリング研究に取り入れている。
様々な時系列データセットの実験は、最先端技術に対する我々のアプローチの優位性を実証している。
論文 参考訳(メタデータ) (2022-12-29T16:43:34Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Mind Your Clever Neighbours: Unsupervised Person Re-identification via
Adaptive Clustering Relationship Modeling [19.532602887109668]
教師なし人物再識別(Re-ID)は、教師付きRe-IDモデルのスケーラビリティ問題を解決する可能性から注目されている。
既存の教師なし手法の多くは反復的なクラスタリング機構を採用しており、教師なしクラスタリングによって生成された擬似ラベルに基づいてネットワークを訓練している。
高品質な擬似ラベルを生成し,クラスタリングエラーの影響を軽減するために,教師なしのRe-IDのための新しいクラスタリング関係モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T10:55:07Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Dynamic Clustering in Federated Learning [15.37652170495055]
本稿では,生成型逆ネットワーク型クラスタリング,クラスタキャリブレーション,クラスタ分割という3相データクラスタリングアルゴリズムを提案する。
提案アルゴリズムは,セルラーネットワークハンドオーバを含む予測モデルの性能を43%向上させる。
論文 参考訳(メタデータ) (2020-12-07T15:30:07Z) - Consensus Clustering With Unsupervised Representation Learning [4.164845768197489]
我々はBootstrap Your Own Latent(BYOL)のクラスタリング能力について検討し、BYOLを使って学習した機能がクラスタリングに最適でないことを観察する。
本稿では,新たなコンセンサスクラスタリングに基づく損失関数を提案するとともに,クラスタリング能力を改善し,類似のクラスタリングに基づく手法より優れたBYOLをエンド・ツー・エンドで学習する。
論文 参考訳(メタデータ) (2020-10-03T01:16:46Z) - Online Deep Clustering for Unsupervised Representation Learning [108.33534231219464]
オンラインディープクラスタリング(ODC)は、交互にではなく、クラスタリングとネットワーク更新を同時に実行する。
我々は,2つの動的メモリモジュール,すなわち,サンプルラベルと特徴を格納するサンプルメモリと,セントロイド進化のためのセントロイドメモリを設計,維持する。
このように、ラベルとネットワークは交互にではなく肩から肩へと進化する。
論文 参考訳(メタデータ) (2020-06-18T16:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。