論文の概要: Automated Crossword Solving
- arxiv url: http://arxiv.org/abs/2205.09665v1
- Date: Thu, 19 May 2022 16:28:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-05-20 17:43:41.147124
- Title: Automated Crossword Solving
- Title(参考訳): 自動クロスワード解法
- Authors: Eric Wallace, Nicholas Tomlin, Albert Xu, Kevin Yang, Eshaan Pathak,
Matthew Ginsberg, Dan Klein
- Abstract要約: 我々のシステムは、The New York Timesのクロスワードで、正確なパズルの精度を57%から82%に改善します。
私たちのシステムは,トップヒューマンクロスワードトーナメントでも優勝しました。
- 参考スコア(独自算出の注目度): 38.36920665368784
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Berkeley Crossword Solver, a state-of-the-art approach for
automatically solving crossword puzzles. Our system works by generating answer
candidates for each crossword clue using neural question answering models and
then combines loopy belief propagation with local search to find full puzzle
solutions. Compared to existing approaches, our system improves exact puzzle
accuracy from 57% to 82% on crosswords from The New York Times and obtains
99.9% letter accuracy on themeless puzzles. Our system also won first place at
the top human crossword tournament, which marks the first time that a computer
program has surpassed human performance at this event. To facilitate research
on question answering and crossword solving, we analyze our system's remaining
errors and release a dataset of over six million question-answer pairs.
- Abstract(参考訳): 本稿では,クロスワードパズルの自動解法であるバークレークロスワードソルバーを提案する。
本システムでは,ニューラル質問応答モデルを用いて,各クロスワード手がかりに対する回答候補を生成し,ループ的信念伝達と局所探索を組み合わせた解を求める。
既存の手法と比較して、我々のシステムは、New York Timesのクロスワードの精度を57%から82%改善し、テーマレスパズルの精度を99.9%向上した。
また,本大会では,コンピュータプログラムが人的パフォーマンスを上回った最初の事例となる,人的クロスワードトーナメントで優勝した。
質問応答とクロスワード解決の研究を容易にするため,システムの残差を分析し,600万以上の質問応答対のデータセットをリリースする。
関連論文リスト
- PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts [47.92619068073141]
我々は、ステップバイステップ、オープンエンド、クリエイティブマルチモーダル推論を評価するために設計された667のパズルハントスタイルの大規模ベンチマークであるPuzzleWorldを紹介した。
ほとんどの最先端モデルでは最終解の精度は1-2%に過ぎず、最高のモデルではパズルの14%しか解けず、ステップワイズ精度は40%に達する。
誤り解析により,現在のモデルは筋力的推論を示し,言語に基づく推論の限界に悩まされ,視覚的および空間的推論に不可欠なスケッチ能力が欠如していることが判明した。
論文 参考訳(メタデータ) (2025-06-06T16:17:09Z) - A Reasoning-Based Approach to Cryptic Crossword Clue Solving [0.18416014644193066]
この研究は、オープンライセンスコンポーネントから構築されたLLMベースの推論システムについて述べる。
i) 解答の仮説, (ii) 語句説明の提案, (iii) 体系化された推論ステップで動作する検証システムを用いて, 秘密の手がかりを解く。
全体として、このシステムは、イギリスのThe TimesやThe Telegraphの新聞から得た手がかりの、挑戦的なCryptoniteデータセット上で、最先端のパフォーマンスを確立している。
論文 参考訳(メタデータ) (2025-06-05T09:43:28Z) - Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.51318974970985]
自然言語でパズルを解くことは、AIにおける長年の課題である。
本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。
動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文 参考訳(メタデータ) (2025-05-22T01:37:40Z) - Proving that Cryptic Crossword Clue Answers are Correct [0.18416014644193066]
「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
論文 参考訳(メタデータ) (2024-07-11T19:13:16Z) - Language Models are Crossword Solvers [1.53744306569115]
我々は大言語モデル(LLM)を用いたクロスワードの解法に挑戦する。
我々は,現在の最先端技術(SoTA)言語モデルが,暗号的クロスワードの手がかりを解読する能力を示すことを示した。
また,LLMを用いて全クロスワードグリッドを解く問題に対処するために,この性能を生かした探索アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-06-13T12:29:27Z) - The WebCrow French Crossword Solver [6.758790625418374]
我々は、自動クロスワードソルバであるWebCrowをフランス語に拡張し、フランス語でクロスワードソルバを行う最初のプログラムとなる。
ヒントと回答のクロスワードデータの大規模なリポジトリがないことに対処するため、WebCrowはエキスパートと呼ばれる複数のモジュールを利用して、異種リソースから候補回答を取得する。
我々は2つの異なる課題において、WebCrowのパフォーマンスを人間と比較した。過去のクロスワードの量が限られていたにもかかわらず、フランスのWebCrowは競争力があり、スピードと精度で人間よりも優れていた。
論文 参考訳(メタデータ) (2023-11-27T08:45:31Z) - Solving Witness-type Triangle Puzzles Faster with an Automatically
Learned Human-Explainable Predicate [0.29005223064604074]
We developed a search-based intelligence puzzle solver for The Witness game。
我々は、ウィットネス型パズルへの部分経路が解経路に合成可能でないかどうかを予測する人間の説明可能な述語を学ぶ。
我々は、学習した述語の重要な性質を証明し、それを検索において後継状態の刈り取りに利用できるようにした。
論文 参考訳(メタデータ) (2023-08-04T18:52:18Z) - Multi-Phase Relaxation Labeling for Square Jigsaw Puzzle Solving [73.58829980121767]
本稿では,大域最適化に基づく二乗ジグソーパズルの解法を提案する。
この手法は完全に自動化されており、事前情報を前提とせず、未知または未知のピースオリエンテーションでパズルを扱うことができる。
論文 参考訳(メタデータ) (2023-03-26T18:53:51Z) - Automated Graph Genetic Algorithm based Puzzle Validation for Faster
Game Desig [69.02688684221265]
本稿では,コンピュータゲームにおける論理パズルを効率的に解くための進化的アルゴリズムを提案する。
制約満足度問題に対するハイブリッド遺伝的アプローチの様々なバリエーションについて論じる。
論文 参考訳(メタデータ) (2023-02-17T18:15:33Z) - Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw
Puzzles [67.39567701983357]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要なトピックである。
近年の自己教師型学習の進歩に触発された本論文は,直感的かつ難解なプレテキストタスクを解くことによって,VADに対処する。
提案手法は3つの公開ベンチマークにおいて最先端のベンチマークよりも優れている。
論文 参考訳(メタデータ) (2022-07-20T19:49:32Z) - Down and Across: Introducing Crossword-Solving as a New NLP Benchmark [11.194615436370507]
25年にわたるニューヨーク・タイムズの日刊クロスワードから収集したクロスワードパズルのコーパスの仕様を公表する。
これらのパズルには、歴史的、事実的、単語の意味、同義語/匿名、補足語、略語、接頭辞/接頭辞、単語プレイ、言語横断の様々な手がかりが含まれている。
論文 参考訳(メタデータ) (2022-05-20T21:16:44Z) - The NTT DCASE2020 Challenge Task 6 system: Automated Audio Captioning
with Keywords and Sentence Length Estimation [49.41766997393417]
本報告では, 音響シーン・イベントの検出・分類に関わるシステムについて述べる。
本論文は,音声の自動字幕化における2つの不確定性,すなわち,単語選択不確定性と文長不確定性に焦点をあてる。
マルチタスク学習によりキーワードと文長を推定することにより,主字幕生成と部分不確定化を同時に解決する。
論文 参考訳(メタデータ) (2020-07-01T04:26:27Z) - PuzzLing Machines: A Challenge on Learning From Small Data [64.513459448362]
我々は,高校生を対象としたLinguistic OlympiadsのRosetta StoneパズルからなるPuzzLing Machinesという,小さなデータから学ぶための課題を紹介した。
私たちのチャレンジには、81言語から幅広い言語現象をカバーする約100のパズルが含まれています。
単純な統計アルゴリズムと最先端のディープニューラルモデルの両方が、予想通り、この課題に対して不十分に実行可能であることを示す。
論文 参考訳(メタデータ) (2020-04-27T20:34:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。