論文の概要: Proving that Cryptic Crossword Clue Answers are Correct
- arxiv url: http://arxiv.org/abs/2407.08824v1
- Date: Thu, 11 Jul 2024 19:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 01:46:09.523807
- Title: Proving that Cryptic Crossword Clue Answers are Correct
- Title(参考訳): Cryptic Crossword Clue Answersが正しいことを証明する
- Authors: Martin Andrews, Sam Witteveen,
- Abstract要約: 「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
- 参考スコア(独自算出の注目度): 0.18416014644193066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cryptic crossword clues are challenging cognitive tasks, for which new test sets are released on a daily basis by multiple international newspapers. Each cryptic clue contains both the definition of the answer to be placed in the crossword grid (in common with regular crosswords), and `wordplay' that proves that the answer is correct (i.e. a human solver can be confident that an answer is correct without needing crossing words to confirm it). Using an existing cryptic wordplay proving framework (operating on Python proofs created by an LLM), we show that it is possible to distinguish between correct answers and almost-correct ones based upon whether the wordplay `works'.
- Abstract(参考訳): クリプティックなクロスワードの手がかりは、新しいテストセットを複数の国際新聞によって毎日リリースする、認知的な課題である。
それぞれの秘密の手がかりには、クロスワードグリッドに置かれる答えの定義(通常のクロスワードと共通する)と、その答えが正しいことを証明する'ワードプレイ'の両方が含まれている(すなわち、人間の解答器は、その答えを確認するためにクロスワードを必要とせずに、答えが正しいことを確信することができる)。
既存の語彙証明フレームワーク(LLMが作成したPython証明を運用する)を用いて,単語の‘works’の有無に基づいて,正しい解答とほぼ正しい解答を区別可能であることを示す。
関連論文リスト
- Language Models are Crossword Solvers [1.53744306569115]
我々は大言語モデル(LLM)を用いたクロスワードの解法に挑戦する。
我々は,現在の最先端技術(SoTA)言語モデルが,暗号的クロスワードの手がかりを解読する能力を示すことを示した。
また,LLMを用いて全クロスワードグリッドを解く問題に対処するために,この性能を生かした探索アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-06-13T12:29:27Z) - Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文 参考訳(メタデータ) (2024-03-26T09:25:57Z) - Deceptive Semantic Shortcuts on Reasoning Chains: How Far Can Models Go without Hallucination? [73.454943870226]
本研究はセマンティックアソシエーションによって誘発される特定の種類の幻覚の研究である。
この現象を定量化するために,EureQAと呼ばれる新しい探索手法とベンチマークを提案する。
論文 参考訳(メタデータ) (2023-11-16T09:27:36Z) - Multi-grained Evidence Inference for Multi-choice Reading Comprehension [62.0773160298008]
MRC(Multi-choice Machine Reading)は、マシンが提供されたオプションに従って質問に答える上で、重要かつ困難なタスクである。
多粒性エビデンスを包括的に統合した多粒性エビデンス推論システム(Mugen)を提案する。
Mugen は3つの異なるエビデンスを抽出し、エビデンスを元のパスと統合し、4つのマルチチョイス MRC ベンチマークで顕著で一貫したパフォーマンス改善を達成する。
論文 参考訳(メタデータ) (2023-10-27T11:36:18Z) - Down and Across: Introducing Crossword-Solving as a New NLP Benchmark [11.194615436370507]
25年にわたるニューヨーク・タイムズの日刊クロスワードから収集したクロスワードパズルのコーパスの仕様を公表する。
これらのパズルには、歴史的、事実的、単語の意味、同義語/匿名、補足語、略語、接頭辞/接頭辞、単語プレイ、言語横断の様々な手がかりが含まれている。
論文 参考訳(メタデータ) (2022-05-20T21:16:44Z) - Automated Crossword Solving [38.36920665368784]
我々のシステムは、The New York Timesのクロスワードで、正確なパズルの精度を57%から82%に改善します。
私たちのシステムは,トップヒューマンクロスワードトーナメントでも優勝しました。
論文 参考訳(メタデータ) (2022-05-19T16:28:44Z) - DialFact: A Benchmark for Fact-Checking in Dialogue [56.63709206232572]
われわれはDialFactという22,245の注釈付き会話クレームのベンチマークデータセットを構築し、ウィキペディアの証拠と組み合わせた。
FEVERのような非対話データでトレーニングされた既存のファクトチェックモデルは、我々のタスクでうまく機能しないことがわかった。
本稿では,対話におけるファクトチェック性能を効果的に向上する,シンプルなデータ効率のソリューションを提案する。
論文 参考訳(メタデータ) (2021-10-15T17:34:35Z) - Spell my name: keyword boosted speech recognition [25.931897154065663]
名前や専門用語のような一般的な言葉は、会話を文脈で理解するのに重要である。
本稿では、これらの非一般的なキーワードをよりよく認識できる、単純だが強力なASR復号法を提案する。
本手法は,音響モデル予測に基づくビームサーチにおいて,与えられたキーワードの確率を高める。
本稿では,本手法の有効性を実世界の会話の内部データとLibriSpeeechテストセットで実証する。
論文 参考訳(メタデータ) (2021-10-06T14:16:57Z) - Decrypting Cryptic Crosswords: Semantically Complex Wordplay Puzzles as
a Target for NLP [5.447716844779342]
クリプティック・クロスワード(Cryptic crosswords)は、イギリスにおける英語を話すクロスワードである。
ベンチマークとして使用可能な暗号クロスワードヒントのデータセットを提示し,それらを解決するためにシーケンス・ツー・シーケンスモデルをトレーニングする。
新たなカリキュラム学習手法により,性能を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2021-04-17T18:54:00Z) - Crossing Variational Autoencoders for Answer Retrieval [50.17311961755684]
質問・回答アライメントと質問・回答セマンティクスは、表現を学ぶための重要な信号である。
そこで本研究では,回答を一致させた質問を生成し,回答を一致した質問で生成することで,変分自動エンコーダを横断する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T01:59:13Z) - Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。
OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。
本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文 参考訳(メタデータ) (2020-03-19T21:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。