論文の概要: Generating Creative Chess Puzzles
- arxiv url: http://arxiv.org/abs/2510.23881v1
- Date: Mon, 27 Oct 2025 21:43:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.522371
- Title: Generating Creative Chess Puzzles
- Title(参考訳): クリエイティヴ・チェス・プッズの生成
- Authors: Xidong Feng, Vivek Veeriah, Marcus Chiam, Michael Dennis, Ryan Pachauri, Thomas Tumiel, Federico Barbero, Johan Obando-Ceron, Jiaxin Shi, Satinder Singh, Shaobo Hou, Nenad Tomašev, Tom Zahavy,
- Abstract要約: チェスエンジンのサーチ統計に基づく新たな報奨付きRLフレームワークを導入し,その欠点を克服する。
報酬はパズルの独特性、反直感性、多様性、リアリズムを高めるように設計されている。
我々のパズルは、新規性と多様性のベンチマークを満たし、美学のテーマを保持し、人間の専門家によって、構成された本パズルよりも創造的で、楽しい、そして、直感に反するものとして評価されている。
- 参考スコア(独自算出の注目度): 27.976252308497603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Generative AI rapidly advances in various domains, generating truly creative, aesthetic, and counter-intuitive outputs remains a challenge. This paper presents an approach to tackle these difficulties in the domain of chess puzzles. We start by benchmarking Generative AI architectures, and then introduce an RL framework with novel rewards based on chess engine search statistics to overcome some of those shortcomings. The rewards are designed to enhance a puzzle's uniqueness, counter-intuitiveness, diversity, and realism. Our RL approach dramatically increases counter-intuitive puzzle generation by 10x, from 0.22\% (supervised) to 2.5\%, surpassing existing dataset rates (2.1\%) and the best Lichess-trained model (0.4\%). Our puzzles meet novelty and diversity benchmarks, retain aesthetic themes, and are rated by human experts as more creative, enjoyable, and counter-intuitive than composed book puzzles, even approaching classic compositions. Our final outcome is a curated booklet of these AI-generated puzzles, which is acknowledged for creativity by three world-renowned experts.
- Abstract(参考訳): Generative AIはさまざまな領域で急速に進歩しているが、真に創造的、美的、そして反直感的なアウトプットを生み出すことは依然として課題である。
本稿では,チェスパズルの分野におけるこれらの課題に対処するためのアプローチを提案する。
まず、生成AIアーキテクチャのベンチマークから始め、チェスエンジンのサーチ統計に基づく新しい報酬を持つRLフレームワークを導入し、これらの欠点を克服します。
報酬はパズルの独特性、反直感性、多様性、リアリズムを高めるように設計されている。
我々のRLアプローチは、既存のデータセットレート (2.1\%) と最高のLichessトレーニングモデル (0.4\%) を超越して、0.22\% (教師付き) から2.5\% まで、反直観的パズル生成を劇的に10倍に向上させる。
我々のパズルは、独創性と多様性のベンチマークを満たし、審美的なテーマを保持し、人間の専門家は、古典的な作品に近づいた書籍パズルよりも、創造的で、楽しい、そして、直感に反するものとして評価されている。
私たちの最終的な成果は、これらのAI生成パズルのキュレートされた小冊子で、世界有数のエキスパート3人が創造性を認めています。
関連論文リスト
- Evaluating In Silico Creativity: An Expert Review of AI Chess Compositions [27.976252308497603]
本稿では、美的魅力、斬新さ、反直感的、独特なソリューションを特徴とするパズルを生成するように設計されたAIシステムを提案する。
システムの創造性を評価するため、我々は、AI生成パズルのキュレートされたブックレットを、世界有数のエキスパート3人に提示した。
論文 参考訳(メタデータ) (2025-10-27T19:00:02Z) - HardcoreLogic: Challenging Large Reasoning Models with Long-tail Logic Puzzle Games [47.168515381473576]
大規模推論モデル(LRM)は、論理パズルゲームを含む複雑なタスクにおける印象的なパフォーマンスを実証している。
既存のコーパスは、9x9 Sudokuのような人気のパズルに焦点を当てており、標準フォーマットに過度に適合し、ソリューションパターンを記憶するリスクがある。
HardcoreLogicは10ゲームにわたる5000以上のパズルの挑戦的なベンチマークである。
論文 参考訳(メタデータ) (2025-10-14T14:23:24Z) - PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts [47.92619068073141]
我々は、ステップバイステップ、オープンエンド、クリエイティブマルチモーダル推論を評価するために設計された667のパズルハントスタイルの大規模ベンチマークであるPuzzleWorldを紹介した。
ほとんどの最先端モデルでは最終解の精度は1-2%に過ぎず、最高のモデルではパズルの14%しか解けず、ステップワイズ精度は40%に達する。
誤り解析により,現在のモデルは筋力的推論を示し,言語に基づく推論の限界に悩まされ,視覚的および空間的推論に不可欠なスケッチ能力が欠如していることが判明した。
論文 参考訳(メタデータ) (2025-06-06T16:17:09Z) - Sudoku-Bench: Evaluating creative reasoning with Sudoku variants [17.624558883326184]
Sudoku-Benchは、創造的で多段階の論理的推論を評価するための、キュレートされたベンチマークである。
Sudoku-Benchには、慎重に選択されたパズルセット、標準化されたテキストベースのパズル表現、数千の公開パズルと互換性のある柔軟なツールが含まれている。
論文 参考訳(メタデータ) (2025-05-22T02:24:35Z) - Solving and Generating NPR Sunday Puzzles with Large Language Models [0.0]
最先端の大規模言語モデルは、多くのPUZZLEQAパズルを解くことができる。
最良のモデルは GPT-3.5 で、50.2% のゆるい精度である。
GPT-3.5は、生成されたルールに従わない答えを持つパズルを生成する。
論文 参考訳(メタデータ) (2023-06-21T13:23:48Z) - Automated Graph Genetic Algorithm based Puzzle Validation for Faster
Game Desig [69.02688684221265]
本稿では,コンピュータゲームにおける論理パズルを効率的に解くための進化的アルゴリズムを提案する。
制約満足度問題に対するハイブリッド遺伝的アプローチの様々なバリエーションについて論じる。
論文 参考訳(メタデータ) (2023-02-17T18:15:33Z) - Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw
Puzzles [67.39567701983357]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要なトピックである。
近年の自己教師型学習の進歩に触発された本論文は,直感的かつ難解なプレテキストタスクを解くことによって,VADに対処する。
提案手法は3つの公開ベンチマークにおいて最先端のベンチマークよりも優れている。
論文 参考訳(メタデータ) (2022-07-20T19:49:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。