論文の概要: Vision Transformers for Computer Go
- arxiv url: http://arxiv.org/abs/2309.12675v1
- Date: Fri, 22 Sep 2023 07:35:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-25 15:30:29.965763
- Title: Vision Transformers for Computer Go
- Title(参考訳): コンピュータgo用視覚トランスフォーマー
- Authors: Amani Sagri and Tristan Cazenave and J\'er\^ome Arjonilla and Abdallah
Saffidine
- Abstract要約: 本研究では,視覚におけるトランスフォーマーの分析に焦点をあてる。
予測精度,勝利率,メモリ,スピード,サイズ,さらには学習率など,多数のポイントの詳細な分析を通じて,トランスフォーマーがGoのゲームで果たす重要な役割を明らかにすることができた。
- 参考スコア(独自算出の注目度): 4.111084095218968
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by the success of transformers in various fields, such as language
understanding and image analysis, this investigation explores their application
in the context of the game of Go. In particular, our study focuses on the
analysis of the Transformer in Vision. Through a detailed analysis of numerous
points such as prediction accuracy, win rates, memory, speed, size, or even
learning rate, we have been able to highlight the substantial role that
transformers can play in the game of Go. This study was carried out by
comparing them to the usual Residual Networks.
- Abstract(参考訳): 言語理解や画像解析など,さまざまな分野におけるトランスフォーマーの成功に動機づけられたこの調査は,goゲームにおける彼らの応用を探求するものだ。
特に,視覚におけるトランスフォーマーの分析に焦点を当てた。
予測精度,勝利率,メモリ,スピード,サイズ,さらには学習率など,多数のポイントの詳細な分析を通じて,トランスフォーマーがGoのゲームで果たす重要な役割を明らかにすることができた。
本研究は,通常の残差ネットワークと比較することにより行った。
関連論文リスト
- Do Vision-Language Transformers Exhibit Visual Commonsense? An Empirical Study of VCR [51.72751335574947]
Visual Commonsense Reasoning (VCR)は、視覚的なシーンに対する質問応答の背後にある説明的推論を要求する。
ベンチマークデータセットの進歩は、Vision-Language Transformers(VL Transformers)の最近の進歩に大きく起因している。
本稿では、VLトランスフォーマーは、VCRの鍵となる視覚的コモンセンスを示さないことを仮定する。
論文 参考訳(メタデータ) (2024-05-27T08:26:58Z) - Advances in Medical Image Analysis with Vision Transformers: A
Comprehensive Review [6.953789750981636]
医療画像におけるトランスフォーマーの応用に関する百科事典のレビューを行う。
具体的には,医療画像解析タスクにおけるトランスフォーマー関連文献の体系的,徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-01-09T16:56:23Z) - Learning Explicit Object-Centric Representations with Vision
Transformers [81.38804205212425]
我々は、マスク付き自動符号化の自己超越タスクを構築し、トランスフォーマーを用いたオブジェクト中心表現学習の有効性を探求する。
複数のマルチオブジェクト・ベンチマークのセグメンテーション・メトリクスによって測定された単純なシーンを効率的に分解できることを示す。
論文 参考訳(メタデータ) (2022-10-25T16:39:49Z) - Vision Transformers for Action Recognition: A Survey [41.69370782177517]
コンピュータビジョン問題を解決する強力なツールとして、ビジョントランスフォーマーが登場している。
最近の技術は、多数のビデオ関連タスクを解決するために、画像領域を超えたトランスフォーマーの有効性を証明している。
人間の行動認識は、広く応用されているため、研究コミュニティから特別に注目を集めている。
論文 参考訳(メタデータ) (2022-09-13T02:57:05Z) - 3D Vision with Transformers: A Survey [114.86385193388439]
自然言語処理におけるトランスフォーマーアーキテクチャの成功は、コンピュータビジョン分野の注目を集めている。
本稿では,異なる3次元視覚タスクのための100以上のトランスフォーマー手法の体系的,徹底的なレビューを行う。
我々は3次元視覚におけるトランスフォーマー設計について議論し、様々な3次元表現でデータを処理できるようにする。
論文 参考訳(メタデータ) (2022-08-08T17:59:11Z) - Vision Transformers: State of the Art and Research Challenges [26.462994554165697]
本稿では,異なるアーキテクチャ設計と視覚変換器のトレーニング手法に関する文献の概要を概説する。
我々の目標は、オープンな研究機会を体系的にレビューすることです。
論文 参考訳(メタデータ) (2022-07-07T02:01:56Z) - Transformers in Time Series: A Survey [66.50847574634726]
時系列モデリングのためのTransformerスキームを,その強みと限界を強調して体系的にレビューする。
ネットワーク構造の観点から、トランスフォーマーに施された適応と修正を要約する。
応用の観点からは,予測,異常検出,分類などの共通タスクに基づいて時系列変換器を分類する。
論文 参考訳(メタデータ) (2022-02-15T01:43:27Z) - Transformers in Vision: A Survey [101.07348618962111]
トランスフォーマーは、入力シーケンス要素間の長い依存関係をモデリングし、シーケンスの並列処理をサポートします。
変圧器は設計に最小限の誘導バイアスを必要とし、自然にセット関数として適しています。
本調査は,コンピュータビジョン分野におけるトランスフォーマーモデルの概要を概観することを目的としている。
論文 参考訳(メタデータ) (2021-01-04T18:57:24Z) - A Survey on Visual Transformer [126.56860258176324]
Transformerは、主に自己認識機構に基づくディープニューラルネットワークの一種である。
本稿では、これらの視覚変換器モデルについて、異なるタスクで分類し、それらの利点と欠点を分析することでレビューする。
論文 参考訳(メタデータ) (2020-12-23T09:37:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。