論文の概要: Determining Chess Game State From an Image
- arxiv url: http://arxiv.org/abs/2104.14963v1
- Date: Fri, 30 Apr 2021 13:02:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 17:10:00.086355
- Title: Determining Chess Game State From an Image
- Title(参考訳): 画像からチェスゲーム状態を決定する
- Authors: Georg W\"olflein and Ognjen Arandjelovi\'c
- Abstract要約: 本稿では,既存のモデルよりも桁違いに大きい3次元モデルから合成した新しいデータセットについて述べる。
従来のコンピュータビジョン技術とディープラーニングを組み合わせた新しいエンドツーエンドチェス認識システムを紹介します。
記述されたシステムでは,テストセット上での誤差率は0.23%であり,現状の28倍である。
- 参考スコア(独自算出の注目度): 19.06796946564999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying the configuration of chess pieces from an image of a chessboard
is a problem in computer vision that has not yet been solved accurately.
However, it is important for helping amateur chess players improve their games
by facilitating automatic computer analysis without the overhead of manually
entering the pieces. Current approaches are limited by the lack of large
datasets and are not designed to adapt to unseen chess sets. This paper puts
forth a new dataset synthesised from a 3D model that is an order of magnitude
larger than existing ones. Trained on this dataset, a novel end-to-end chess
recognition system is presented that combines traditional computer vision
techniques with deep learning. It localises the chessboard using a RANSAC-based
algorithm that computes a projective transformation of the board onto a regular
grid. Using two convolutional neural networks, it then predicts an occupancy
mask for the squares in the warped image and finally classifies the pieces. The
described system achieves an error rate of 0.23% per square on the test set, 28
times better than the current state of the art. Further, a few-shot transfer
learning approach is developed that is able to adapt the inference system to a
previously unseen chess set using just two photos of the starting position,
obtaining a per-square accuracy of 99.83% on images of that new chess set. The
dataset is released publicly; code and trained models are available at
https://github.com/georgw777/chesscog.
- Abstract(参考訳): チェス盤の画像からチェス駒の構成を識別することは、まだ正確には解決されていないコンピュータビジョンの問題である。
しかし,手作業で手入力するオーバーヘッドを伴わずに,コンピュータの自動解析を容易にすることで,アマチュアチェス選手のゲーム改善を支援することが重要である。
現在のアプローチは、巨大なデータセットの欠如によって制限され、見えないチェスセットに適応するように設計されていない。
本稿では,既存のモデルよりも桁違いに大きい3次元モデルから合成した新しいデータセットについて述べる。
このデータセットでトレーニングされた新しいエンドツーエンドチェス認識システムは、従来のコンピュータビジョン技術とディープラーニングを組み合わせたものだ。
RANSACベースのアルゴリズムを用いてチェスボードをローカライズし、ボードの通常のグリッドへの射影変換を計算する。
2つの畳み込みニューラルネットワークを使って、歪んだ画像の正方形の占有マスクを予測し、最終的に部品を分類する。
記述されたシステムでは,テストセット上での誤差率は0.23%であり,現状の28倍である。
さらに、開始位置の2枚の写真のみを用いて、推論システムを未確認のチェスセットに適応させ、新しいチェスセットの画像の2乗あたりの精度99.83%を得る、数発の転写学習手法も開発されている。
データセットは公開されており、コードとトレーニングされたモデルはhttps://github.com/georgw777/chesscogで入手できる。
関連論文リスト
- Predicting Chess Puzzle Difficulty with Transformers [0.0]
GlickFormerは,Glicko-2レーティングシステムを用いて,チェスパズルの難易度を予測するトランスフォーマーアーキテクチャである。
提案モデルでは,空間的特徴抽出にChessFormerのバックボーンを改良し,分解変換技術を用いて時間情報を組み込んだ。
結果は、GlickFormerのパフォーマンスが、最先端のChessFormerベースラインと比較して、複数のメトリクスにわたって優れていることを示している。
論文 参考訳(メタデータ) (2024-10-14T20:39:02Z) - Amortized Planning with Large-Scale Transformers: A Case Study on Chess [11.227110138932442]
本稿では,AIにおける画期的な計画問題であるチェスを用いて,計画課題の性能評価を行う。
ChessBenchは、Stockfishが提供する法的行動と価値アノテーション(1500億ポイント)を備えた1000万のチェスゲームの大規模なベンチマークである。
極めて優れた近似を教師付き学習により大規模変圧器に蒸留することは可能であるが, 完全蒸留は依然として到達範囲を超えている。
論文 参考訳(メタデータ) (2024-02-07T00:36:24Z) - Self-supervised Learning of LiDAR 3D Point Clouds via 2D-3D Neural Calibration [107.61458720202984]
本稿では,自律走行シーンにおける3次元知覚を高めるための,新しい自己教師型学習フレームワークを提案する。
本稿では,画像とポイントクラウドデータの領域ギャップを埋めるために,学習可能な変換アライメントを提案する。
我々は剛性ポーズを推定するために密度の高い2D-3D対応を確立する。
論文 参考訳(メタデータ) (2024-01-23T02:41:06Z) - Learning to Play Chess from Textbooks (LEAP): a Corpus for Evaluating
Chess Moves based on Sentiment Analysis [4.314956204483074]
本稿では,チェスの遊び方を学ぶための新しい知識源として,チェスの教科書について検討する。
我々はLEAPコーパスを開発した。LEAPコーパスは、構造化された(記法やボード状態を動かす)構造付きおよび非構造化データを備えた、最初の、そして新しい異種データセットである。
感情分析のための各種変圧器ベースラインモデルの性能評価実験を行った。
論文 参考訳(メタデータ) (2023-10-31T08:26:02Z) - End-to-End Chess Recognition [11.15543089335477]
現在のアプローチでは、チェスボードの検出、平方ローカライゼーション、ピース分類といった独立した独立したモジュールのパイプラインを使用している。
本稿では、画像から構成を直接予測するエンドツーエンドアプローチについて検討し、シーケンシャルアプローチのエラー蓄積を回避する。
合成レンダリングされ、角度が限られている既存のデータセットとは対照的に、ChessReDはスマートフォンカメラを使ってさまざまな角度から撮影されている。
ChessReDのテスト画像の15.26%で、チェスのピースの構成を認識することに成功した。
論文 参考訳(メタデータ) (2023-10-06T08:30:20Z) - The Change You Want to See (Now in 3D) [65.61789642291636]
本稿の目的は、同じ3Dシーンの2つの「野生」画像の間で何が変わったかを検出することである。
我々は,全合成データに基づいて学習し,クラスに依存しない変化検出モデルに貢献する。
我々は,人間に注釈を付けた実世界のイメージペアによる評価データセットを新たにリリースした。
論文 参考訳(メタデータ) (2023-08-21T01:59:45Z) - The Update-Equivalence Framework for Decision-Time Planning [78.44953498421854]
本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-04-25T20:28:55Z) - Learning 3D Representations from 2D Pre-trained Models via
Image-to-Point Masked Autoencoders [52.91248611338202]
I2P-MAEという名前のイメージ・ツー・ポイント・マスケッド・オートエンコーダを用いて,2次元事前学習モデルから優れた3次元表現を得る方法を提案する。
自己教師付き事前学習により、よく学習された2D知識を利用して、3Dマスクによる自動エンコーディングをガイドする。
I2P-MAEは最先端の90.11%の精度、+3.68%の精度で第2ベストに到達し、より優れた転送能力を示す。
論文 参考訳(メタデータ) (2022-12-13T17:59:20Z) - No-Regret Learning in Time-Varying Zero-Sum Games [99.86860277006318]
固定ゼロサムゲームにおける繰り返しプレイからの学習は、ゲーム理論とオンライン学習における古典的な問題である。
提案手法は,3つの性能基準の下で,良好な保証を同時に享受できる1つのパラメータフリーアルゴリズムである。
本アルゴリズムは,ある特性を満たすブラックボックスベースラーナー群に対するメタアルゴリズムを用いた2層構造に基づく。
論文 参考訳(メタデータ) (2022-01-30T06:10:04Z) - Back to the Feature: Learning Robust Camera Localization from Pixels to
Pose [114.89389528198738]
画像と3Dモデルから正確な6-DoFのポーズを推定するシーンに依存しないニューラルネットワークPixLocを導入する。
このシステムは、粗いポーズ前の大きな環境でもローカライズできるが、スパース特徴マッチングの精度も向上する。
論文 参考訳(メタデータ) (2021-03-16T17:40:12Z) - LiveChess2FEN: a Framework for Classifying Chess Pieces based on CNNs [0.0]
我々は,1秒未満で画像からチェス位置を自動的にデジタル化する機能的フレームワークを実装した。
チェスの駒の分類と組込みプラットフォーム上で効率的にマップする方法について、さまざまな畳み込みニューラルネットワークを分析した。
論文 参考訳(メタデータ) (2020-12-12T16:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。