Fugu-MT 論文翻訳(概要): A Reasoning-Based Approach to Cryptic Crossword Clue Solving

論文の概要: A Reasoning-Based Approach to Cryptic Crossword Clue Solving

arxiv url: http://arxiv.org/abs/2506.04824v1
Date: Thu, 05 Jun 2025 09:43:28 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-06 21:53:49.640402
Title: A Reasoning-Based Approach to Cryptic Crossword Clue Solving
Title（参考訳）: クリプティック・クロスワード・クローズ・ソルビングに対する推論に基づくアプローチ
Authors: Martin Andrews, Sam Witteveen,
Abstract要約: この研究は、オープンライセンスコンポーネントから構築されたLLMベースの推論システムについて述べる。 i) 解答の仮説, (ii) 語句説明の提案, (iii) 体系化された推論ステップで動作する検証システムを用いて, 秘密の手がかりを解く。全体として、このシステムは、イギリスのThe TimesやThe Telegraphの新聞から得た手がかりの、挑戦的なCryptoniteデータセット上で、最先端のパフォーマンスを確立している。
参考スコア（独自算出の注目度）: 0.18416014644193066
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Cryptic crossword clues are challenging language tasks for which new test sets are released daily by major newspapers on a global basis. Each cryptic clue contains both the definition of the answer to be placed in the crossword grid (in common with regular crosswords), and 'wordplay' that proves that the answer is correct (i.e. a human solver can be confident that an answer is correct without needing crossing words as confirmation). This work describes an LLM-based reasoning system built from open-licensed components that solves cryptic clues by (i) hypothesising answers; (ii) proposing wordplay explanations; and (iii) using a verifier system that operates on codified reasoning steps. Overall, this system establishes a new state-of-the-art performance on the challenging Cryptonite dataset of clues from The Times and The Telegraph newspapers in the UK. Because each proved solution is expressed in Python, interpretable wordplay reasoning for proven answers is available for inspection.
Abstract（参考訳）: クリプティックなクロスワードのヒントは、世界中の新聞によって毎日新しいテストセットがリリースされる言語タスクである。各秘密の手がかりには、クロスワードグリッドに置かれる答えの定義(通常のクロスワードと共通する)と、その答えが正しいことを証明する「ワードプレイ」の両方が含まれている(つまり、人間の解法は、クロスワードを確認として必要とせずに、答えが正しいことを確信することができる)。本研究は,オープンライセンスコンポーネントをベースとしたLLMベースの推論システムについて述べる。 (i)仮説の答え (二)語句説明の提案、及び三法定推論の段階を定式化する検証器を用いること。全体として、このシステムは、イギリスのThe TimesやThe Telegraphの新聞から得た手がかりの、挑戦的なCryptoniteデータセット上で、最先端のパフォーマンスを確立している。証明された各ソリューションはPythonで表現されるため、検証された回答に対する解釈可能なワードプレイ推論が検査に利用可能である。

関連論文リスト

Inferential Question Answering [67.54465021408724]
新しいタスクであるInferential QAを導入します。これは、答えをサポートするパスから答えを推測するためにモデルに挑戦するものです。そこで本研究では,7,401問と2.4M節からなるQUITデータセットを構築した。我々は,従来のQAタスクに有効な手法が推論QAに苦しむことを示し,レトリバーは性能が低下し,リランカーは利得が制限され,微調整は不整合の改善をもたらすことを示した。
論文参考訳（メタデータ） (2026-02-01T14:02:43Z)
Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.51318974970985]
自然言語でパズルを解くことは、AIにおける長年の課題である。本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文参考訳（メタデータ） (2025-05-22T01:37:40Z)
Proving that Cryptic Crossword Clue Answers are Correct [0.18416014644193066]
「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
論文参考訳（メタデータ） (2024-07-11T19:13:16Z)
Language Models are Crossword Solvers [1.53744306569115]
我々は,大言語モデル(LLM)を用いたクロスワードの解法に挑戦する。現代の言語モデルでは、暗号的クロスワードの手がかりを解読する能力が非常に高いことが実証されている。また,この性能を生かした検索アルゴリズムを開発し,アウトオブボックス LLM を用いて全クロスワードグリッドを解く問題に対処する。
論文参考訳（メタデータ） (2024-06-13T12:29:27Z)
Language Models can be Logical Solvers [99.40649402395725]
論理解法の推論過程を直接エミュレートする新しい言語モデルであるLoGiPTを導入する。 LoGiPTは、導出的ソルバの見えない推論過程を明らかにして精錬することから導かれる、新しく構築された命令チューニングデータセットに基づいて微調整される。
論文参考訳（メタデータ） (2023-11-10T16:23:50Z)
Multi-grained Evidence Inference for Multi-choice Reading Comprehension [62.0773160298008]
MRC(Multi-choice Machine Reading)は、マシンが提供されたオプションに従って質問に答える上で、重要かつ困難なタスクである。多粒性エビデンスを包括的に統合した多粒性エビデンス推論システム(Mugen)を提案する。 Mugen は3つの異なるエビデンスを抽出し、エビデンスを元のパスと統合し、4つのマルチチョイス MRC ベンチマークで顕著で一貫したパフォーマンス改善を達成する。
論文参考訳（メタデータ） (2023-10-27T11:36:18Z)
Re-Reading Improves Reasoning in Large Language Models [87.46256176508376]
既成のLarge Language Models (LLM) の推論能力を高めるため, 単純で汎用的で効果的なプロンプト手法であるRe2を導入する。 CoT (Chain-of-Thought) など、ほとんどの思考を刺激する手法とは異なり、Re2 は質問を2回処理することで入力に焦点を移し、理解プロセスを強化する。提案手法の有効性と汎用性を検証するため,14のデータセットにまたがる広範囲な推論ベンチマークでRe2を評価した。
論文参考訳（メタデータ） (2023-09-12T14:36:23Z)
Down and Across: Introducing Crossword-Solving as a New NLP Benchmark [11.194615436370507]
25年にわたるニューヨーク・タイムズの日刊クロスワードから収集したクロスワードパズルのコーパスの仕様を公表する。これらのパズルには、歴史的、事実的、単語の意味、同義語/匿名、補足語、略語、接頭辞/接頭辞、単語プレイ、言語横断の様々な手がかりが含まれている。
論文参考訳（メタデータ） (2022-05-20T21:16:44Z)
Automated Crossword Solving [38.36920665368784]
我々のシステムは、The New York Timesのクロスワードで、正確なパズルの精度を57%から82%に改善します。私たちのシステムは,トップヒューマンクロスワードトーナメントでも優勝しました。
論文参考訳（メタデータ） (2022-05-19T16:28:44Z)
Exploiting Reasoning Chains for Multi-hop Science Question Answering [51.86289192292466]
我々のフレームワークは、コーパス固有のアノテーションを必要とせずに説明可能な推論を行うことができる。ローカルチェーン情報とグローバルチェーン情報の両方に関するTextitChain対応の損失は、生成されたチェーンが遠隔監視信号として機能するようにも設計されている。
論文参考訳（メタデータ） (2021-09-07T07:22:07Z)
Decrypting Cryptic Crosswords: Semantically Complex Wordplay Puzzles as a Target for NLP [28.479149974110463]
クリプティッククロスワード(英: Cryptic crosswords)は、NLPシステムの進歩に向けた有望なターゲットである。我々は、NLPシステムの新しいベンチマークとして、秘密の手がかりのデータセットを提示する。また、課題データ分割を導入し、サブワード・トークン化モデルのメタ言語的能力を検証し、手掛かりのワードプレイ部分を摂動することでモデル体系性を検討する。
論文参考訳（メタデータ） (2021-04-17T18:54:00Z)
Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。 OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文参考訳（メタデータ） (2020-03-19T21:24:45Z)
Retrospective Reader for Machine Reading Comprehension [90.6069071495214]
機械読み取り理解(英: Machine reading comprehension、MRC)とは、機械が与えられた文節に基づいて質問に対する正しい答えを決定することを要求するAIチャレンジである。不可解な質問が MRC タスクに関与している場合、検証モジュールと呼ばれる本質的な検証モジュールがエンコーダに加えて特に必要となる。本稿では, MRC タスクに対して, 解答不能な質問に対して, より優れた検証器設計を提案する。
論文参考訳（メタデータ） (2020-01-27T11:14:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。