論文の概要: Unsupervised Hebbian Learning on Point Sets in StarCraft II
- arxiv url: http://arxiv.org/abs/2207.12323v1
- Date: Wed, 13 Jul 2022 13:09:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-31 14:20:01.419411
- Title: Unsupervised Hebbian Learning on Point Sets in StarCraft II
- Title(参考訳): StarCraft IIにおける点集合の教師なしヘビアン学習
- Authors: Beomseok Kang, Harshit Kumar, Saurabh Dash, Saibal Mukhopadhyay
- Abstract要約: 本稿では,StarCraft IIゲームユニットにおける点集合のグローバルな特徴を抽出するヘビアン学習手法を提案する。
我々のモデルはエンコーダ、LSTM、デコーダを含み、教師なし学習法でエンコーダを訓練する。
- 参考スコア(独自算出の注目度): 12.095363582092904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning the evolution of real-time strategy (RTS) game is a challenging
problem in artificial intelligent (AI) system. In this paper, we present a
novel Hebbian learning method to extract the global feature of point sets in
StarCraft II game units, and its application to predict the movement of the
points. Our model includes encoder, LSTM, and decoder, and we train the encoder
with the unsupervised learning method. We introduce the concept of neuron
activity aware learning combined with k-Winner-Takes-All. The optimal value of
neuron activity is mathematically derived, and experiments support the
effectiveness of the concept over the downstream task. Our Hebbian learning
rule benefits the prediction with lower loss compared to self-supervised
learning. Also, our model significantly saves the computational cost such as
activations and FLOPs compared to a frame-based approach.
- Abstract(参考訳): リアルタイム戦略(RTS)ゲームの進化を学習することは、人工知能(AI)システムにおいて難しい問題である。
本稿では,StarCraft IIゲームユニットにおける点集合のグローバルな特徴を抽出する新しいヘビアン学習法とその点の移動予測への応用について述べる。
我々のモデルはエンコーダ、LSTM、デコーダを含み、教師なし学習法でエンコーダを訓練する。
我々は、k-Winner-Takes-Allと組み合わせたニューロン活動意識学習の概念を紹介した。
ニューロン活動の最適値は数学的に導出され、実験は下流課題に対する概念の有効性を支持する。
我々のヘビー学習規則は、自己教師付き学習よりも損失が少ない予測に利点がある。
また,本モデルはフレームベースアプローチと比較して,アクティベーションやフラップなどの計算コストを大幅に削減する。
関連論文リスト
- Game Theory Meets Statistical Mechanics in Deep Learning Design [0.06990493129893112]
本稿では,ゲーム理論の原理と統計力学の法則をシームレスに融合する新しいディープ表現を提案する。
単一の学習フレームワーク内で特徴抽出、次元縮小、パターン分類を行う。
論文 参考訳(メタデータ) (2024-10-16T06:02:18Z) - A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク
i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文 参考訳(メタデータ) (2024-09-18T14:57:13Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Bridging Logic and Learning: A Neural-Symbolic Approach for Enhanced
Reasoning in Neural Models (ASPER) [0.13053649021965597]
本稿では,学習推論タスクにおけるニューラルモデルの性能向上を目的としたアプローチを提案する。
これを実現するために、Answer Set Programmingソルバとドメイン固有の専門知識を統合する。
モデルは、トレーニングとテストのためにたった12のパズルを使用して、スドゥークパズルの解法を大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-12-18T19:06:00Z) - Learning Two-Player Mixture Markov Games: Kernel Function Approximation
and Correlated Equilibrium [157.0902680672422]
非線形関数近似を用いた2プレイヤーゼロサムマルコフゲームにおけるナッシュ平衡の学習について検討する。
双対性ギャップを最小化してナッシュ均衡を求める新しいオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T14:21:54Z) - Hebbian Continual Representation Learning [9.54473759331265]
継続的学習は、より現実的なシナリオに機械学習をもたらすことを目的としています。
生物学的にインスパイアされたヘビアン学習が継続的な課題に対処するのに有用かどうかを検討する。
論文 参考訳(メタデータ) (2022-06-28T09:21:03Z) - Unsupervised Learning of Neurosymbolic Encoders [40.3575054882791]
本稿では,ニューロシンボリックエンコーダの教師なし学習のためのフレームワークを提案する。
このようなフレームワークは自然に記号的専門家の知識を学習プロセスに組み込むことができ、完全なニューラルエンコーダよりも解釈可能で分解可能な潜在表現をもたらす。
論文 参考訳(メタデータ) (2021-07-28T02:16:14Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Towards Efficient Processing and Learning with Spikes: New Approaches
for Multi-Spike Learning [59.249322621035056]
各種タスクにおける他のベースラインよりも優れた性能を示すための2つの新しいマルチスパイク学習ルールを提案する。
特徴検出タスクでは、教師なしSTDPの能力と、その制限を提示する能力を再検討する。
提案した学習ルールは,特定の制約を適用せずに,幅広い条件で確実にタスクを解くことができる。
論文 参考訳(メタデータ) (2020-05-02T06:41:20Z) - Integration of Leaky-Integrate-and-Fire-Neurons in Deep Learning
Architectures [0.0]
生物学的にインスパイアされたニューロンモデルが情報符号化の斬新で効率的な方法を提供することを示す。
LIF単位に対する簡単な更新ルールを微分方程式から導出した。
本手法をIRIS花のイメージデータセットに適用し,画像分類タスクにおけるLIFニューロンのトレーニングに使用することができることを示す。
論文 参考訳(メタデータ) (2020-04-28T13:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。