論文の概要: Learning Task-Independent Game State Representations from Unlabeled
Images
- arxiv url: http://arxiv.org/abs/2206.06490v1
- Date: Mon, 13 Jun 2022 21:37:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-16 09:24:02.367100
- Title: Learning Task-Independent Game State Representations from Unlabeled
Images
- Title(参考訳): 未ラベル画像からのタスク依存型ゲーム状態表現の学習
- Authors: Chintan Trivedi, Konstantinos Makantasis, Antonios Liapis, Georgios N.
Yannakakis
- Abstract要約: 自己教師付き学習(SSL)技術は、複雑なデータからコンパクトで情報的な表現を学ぶために広く用いられている。
本稿では,ゲームの状態表現を正確に学習するタスクにSSLメソッドを活用できるかどうかを検討する。
- 参考スコア(独自算出の注目度): 2.570570340104555
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning (SSL) techniques have been widely used to learn
compact and informative representations from high-dimensional complex data. In
many computer vision tasks, such as image classification, such methods achieve
state-of-the-art results that surpass supervised learning approaches. In this
paper, we investigate whether SSL methods can be leveraged for the task of
learning accurate state representations of games, and if so, to what extent.
For this purpose, we collect game footage frames and corresponding sequences of
games' internal state from three different 3D games: VizDoom, the CARLA racing
simulator and the Google Research Football Environment. We train an image
encoder with three widely used SSL algorithms using solely the raw frames, and
then attempt to recover the internal state variables from the learned
representations. Our results across all three games showcase significantly
higher correlation between SSL representations and the game's internal state
compared to pre-trained baseline models such as ImageNet. Such findings suggest
that SSL-based visual encoders can yield general -- not tailored to a specific
task -- yet informative game representations solely from game pixel
information. Such representations can, in turn, form the basis for boosting the
performance of downstream learning tasks in games, including gameplaying,
content generation and player modeling.
- Abstract(参考訳): 自己教師付き学習(SSL)技術は、高次元複素データからコンパクトで情報的な表現を学習するために広く用いられている。
画像分類などの多くのコンピュータビジョンタスクにおいて、このような手法は教師付き学習手法を超える最先端の結果が得られる。
本稿では,ゲームの状態表現を正確に学習するタスクにおいて,SSL手法をどの程度活用できるかを検討する。
そこで本研究では,VizDoom,CARLAレーシングシミュレータ,Google Research Football Environmentという3つの異なる3Dゲームから,ゲーム映像フレームとそれに対応するゲームの内部状態を収集する。
画像エンコーダを生フレームのみを使用して3つの広く使用されているsslアルゴリズムでトレーニングし,学習した表現から内部状態変数を復元する。
その結果,ImageNetなどのトレーニング済みベースラインモデルと比較して,SSL表現とゲーム内部状態の相関が著しく高いことがわかった。
このような発見は、SSLベースのビジュアルエンコーダは、特定のタスクに合わせたものではなく、一般的な -- ゲームピクセル情報のみから情報的なゲーム表現が得られることを示唆している。
このような表現は、ゲームプレイング、コンテンツ生成、プレイヤーモデリングなど、ゲームにおける下流学習タスクのパフォーマンスを高める基盤を形成することができる。
関連論文リスト
- PonderV2: Pave the Way for 3D Foundation Model with A Universal
Pre-training Paradigm [114.47216525866435]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Do SSL Models Have D\'ej\`a Vu? A Case of Unintended Memorization in
Self-supervised Learning [47.46863155263094]
自己教師付き学習(SSL)アルゴリズムは、自然画像の様々な部分を相互に関連付けることを学ぶことによって、有用な画像表現を生成することができる。
SSLモデルは、意味的に意味のある関連を学習するのではなく、個別のトレーニングサンプルの特定の部分を意図せずに記憶することができる。
背景のみを含む訓練画像の訓練モデルと収穫量を考えると,前景オブジェクトを高精度に推測できることを示す。
論文 参考訳(メタデータ) (2023-04-26T22:29:49Z) - CLIP$^2$: Contrastive Language-Image-Point Pretraining from Real-World
Point Cloud Data [80.42480679542697]
現実シナリオにおける3Dポイントクラウド表現の伝達を学習するために,Contrastive Language-Image-Point Cloud Pretraining (CLIP$2$)を提案する。
具体的には、2Dおよび3Dシナリオで自然に存在する対応を利用して、それらの複雑なシナリオから、適切に整列されたインスタンスベースのテキストイメージポイントプロキシを構築します。
論文 参考訳(メタデータ) (2023-03-22T09:32:45Z) - Game State Learning via Game Scene Augmentation [2.570570340104555]
我々はゲームエンジンを利用して、異なるゲーム状態の特定の、高度に制御されたレンダリングを定義し、合成する新しいゲームシーン拡張技術、GameCLRを紹介した。
この結果から,ゲームCLRはベースラインよりもゲーム映像からゲームの状態情報を正確に推測できる可能性が示唆された。
論文 参考訳(メタデータ) (2022-07-04T09:40:14Z) - Self Supervised Learning for Few Shot Hyperspectral Image Classification [57.2348804884321]
HSI分類に自己監督学習(SSL)を活用することを提案する。
最先端のSSLアルゴリズムであるBarlow-Twinsを用いて,ラベルのない画素にエンコーダを事前学習することにより,少数のラベルを持つ正確なモデルが得られることを示す。
論文 参考訳(メタデータ) (2022-06-24T07:21:53Z) - Bag of Image Patch Embedding Behind the Success of Self-Supervised
Learning [12.480529556920974]
この研究は、共同埋め込み型SSLアプローチがイメージパッチの表現を学習し、その共起を反映していることを示している。
画像表現がベースライン法とよく似た結果が得られるように,固定スケールのパッチの表現を学習し,局所的なパッチの表現を集約することが実証的に示される。
論文 参考訳(メタデータ) (2022-06-17T18:11:23Z) - Self-supervised Learning for Sonar Image Classification [6.1947705963945845]
自己教師付き学習は、大きなラベル付きデータセットを必要とせずに画像表現を学習するための強力なアプローチであることが証明された。
実生活ソナー画像データセットの事前学習および転送学習結果について述べる。
論文 参考訳(メタデータ) (2022-04-20T08:58:35Z) - Scaling Up Visual and Vision-Language Representation Learning With Noisy
Text Supervision [57.031588264841]
高価なフィルタリングや後処理のステップを使わずに得られる10億以上の画像アルトテキストペアのノイズの多いデータセットを活用します。
単純なデュアルエンコーダアーキテクチャは、画像とテキストペアの視覚的および言語的表現を、対照的な損失を使って整列させることを学ぶ。
コーパスのスケールはノイズを補うことができ、そのような単純な学習方式であっても最先端の表現に繋がることを示す。
論文 参考訳(メタデータ) (2021-02-11T10:08:12Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。