論文の概要: Decrypting Cryptic Crosswords: Semantically Complex Wordplay Puzzles as
a Target for NLP
- arxiv url: http://arxiv.org/abs/2104.08620v1
- Date: Sat, 17 Apr 2021 18:54:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-23 07:40:34.849413
- Title: Decrypting Cryptic Crosswords: Semantically Complex Wordplay Puzzles as
a Target for NLP
- Title(参考訳): クリプティッククロスワードの復号:NLPのターゲットとしての意味論的に複雑なワードプレイパズル
- Authors: Josh Rozner, Christopher Potts, Kyle Mahowald
- Abstract要約: クリプティック・クロスワード(Cryptic crosswords)は、イギリスにおける英語を話すクロスワードである。
ベンチマークとして使用可能な暗号クロスワードヒントのデータセットを提示し,それらを解決するためにシーケンス・ツー・シーケンスモデルをトレーニングする。
新たなカリキュラム学習手法により,性能を大幅に向上できることを示す。
- 参考スコア(独自算出の注目度): 5.447716844779342
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cryptic crosswords, the dominant English-language crossword variety in the
United Kingdom, can be solved by expert humans using flexible, creative
intelligence and knowledge of language. Cryptic clues read like fluent natural
language, but they are adversarially composed of two parts: a definition and a
wordplay cipher requiring sub-word or character-level manipulations. As such,
they are a promising target for evaluating and advancing NLP systems that seek
to process language in more creative, human-like ways. We present a dataset of
cryptic crossword clues from a major newspaper that can be used as a benchmark
and train a sequence-to-sequence model to solve them. We also develop related
benchmarks that can guide development of approaches to this challenging task.
We show that performance can be substantially improved using a novel curriculum
learning approach in which the model is pre-trained on related tasks involving,
e.g, unscrambling words, before it is trained to solve cryptics. However, even
this curricular approach does not generalize to novel clue types in the way
that humans can, and so cryptic crosswords remain a challenge for NLP systems
and a potential source of future innovation.
- Abstract(参考訳): イギリスで支配的な英語のクロスワードであるcryptic crosswordsは、柔軟で創造的な知性と言語知識を用いて専門家によって解決することができる。
難解な手掛かりは流れる自然言語のように読めるが、反対に2つの部分から成り立っている:定義と、サブワードまたは文字レベルの操作を必要とするワードプレイ暗号である。
そのため、より創造的で人間的な方法で言語を処理しようとするNLPシステムの評価と発展のための有望な目標である。
そこで本研究では,主要な新聞社から得られた暗号的なクロスワードの手がかりのデータセットを,ベンチマークとして使用し,それらを解くためにシーケンス・ツー・シーケンスモデルを訓練する。
また、この課題へのアプローチ開発をガイドする関連するベンチマークも開発しています。
そこで本研究では,暗号解読の学習に先立って,非スクランブル語などの関連タスクで事前学習を行う新たなカリキュラム学習手法を用いて,性能を大幅に向上できることを示す。
しかし、この曲がりくねったアプローチでさえ、人間ができるような新しい手がかり型には一般化しておらず、暗号的なクロスワードはnlpシステムと将来のイノベーションの潜在的な源である。
関連論文リスト
- A survey of neural-network-based methods utilising comparable data for finding translation equivalents [0.0]
NLPの最も一般的なアプローチとして,必要な辞書コンポーネントの1つを自動生成する手法を提案する。
記述法の改善に欠かせないので,レキソグラフィの観点から解析する。
この調査は、NLPフィールドがレキシコグラフィーの洞察の恩恵を受けることができるため、NLPフィールドとレキシコグラフィーフィールドの接続を奨励する。
論文 参考訳(メタデータ) (2024-10-19T16:10:41Z) - Language Models are Crossword Solvers [1.53744306569115]
我々は大言語モデル(LLM)を用いたクロスワードの解法に挑戦する。
我々は,現在の最先端技術(SoTA)言語モデルが,暗号的クロスワードの手がかりを解読する能力を示すことを示した。
また,LLMを用いて全クロスワードグリッドを解く問題に対処するために,この性能を生かした探索アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-06-13T12:29:27Z) - A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language
Models [56.25156596019168]
本稿では,LMRL-Gymベンチマークを用いて,大規模言語モデル(LLM)のマルチターンRLの評価を行う。
我々のベンチマークは8つの異なる言語タスクで構成されており、複数ラウンドの言語相互作用が必要であり、オープンエンド対話やテキストゲームにおける様々なタスクをカバーする。
論文 参考訳(メタデータ) (2023-11-30T03:59:31Z) - Italian Crossword Generator: Enhancing Education through Interactive
Word Puzzles [9.84767617576152]
我々はクロスワードの手がかりを生成し検証するための総合システムを開発した。
モデルを微調整するために、ヒントと答えのペアのデータセットがコンパイルされた。
与えられたテキストからクロスワードの手がかりを生成するために、ゼロ/フォーショット学習技術が用いられた。
論文 参考訳(メタデータ) (2023-11-27T11:17:29Z) - Large Language Models are Fixated by Red Herrings: Exploring Creative
Problem Solving and Einstellung Effect using the Only Connect Wall Dataset [4.789429120223149]
人間の模倣AIの探求は、その誕生以来、AI研究において永続的な話題となっている。
人間の創造的問題解決は認知神経科学においてよく研究されているトピックである。
Connect Wallのセグメントだけが、基本的にはメドニックのRemote Associates Test (RAT)の定式化を、ビルトインで故意に赤いハーリングで模倣している。
論文 参考訳(メタデータ) (2023-06-19T21:14:57Z) - Prompting Language Models for Linguistic Structure [73.11488464916668]
本稿では,言語構造予測タスクに対する構造化プロンプト手法を提案する。
提案手法は, 音声タグ付け, 名前付きエンティティ認識, 文チャンキングについて評価する。
PLMはタスクラベルの事前知識を事前学習コーパスに漏えいすることで有意な事前知識を含むが、構造化プロンプトは任意のラベルで言語構造を復元することも可能である。
論文 参考訳(メタデータ) (2022-11-15T01:13:39Z) - Retrieval-Augmented Multilingual Keyphrase Generation with
Retriever-Generator Iterative Training [66.64843711515341]
キーフレーズ生成は、長いテキストが与えられたキーフレーズを自動的に予測するタスクである。
我々は多言語キーフレーズ生成という新しい設定に注意を払っている。
非英語言語におけるデータ不足問題を軽減するために,多言語キーフレーズ生成のための検索拡張手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T00:45:21Z) - Between words and characters: A Brief History of Open-Vocabulary
Modeling and Tokenization in NLP [22.772546707304766]
単語と文字のハイブリッドなアプローチと,学習セグメンテーションに基づくサブワードベースのアプローチが提案され,評価されていることを示す。
すべてのアプリケーションに対して銀の弾丸特異解が存在することはあり得ない。
論文 参考訳(メタデータ) (2021-12-20T13:04:18Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - On the Importance of Word Order Information in Cross-lingual Sequence
Labeling [80.65425412067464]
ソース言語の単語順に適合する言語間モデルでは、ターゲット言語を処理できない可能性がある。
本研究では,ソース言語の単語順序に敏感なモデルを作成することで,対象言語の適応性能が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2020-01-30T03:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。