論文の概要: Clue-Instruct: Text-Based Clue Generation for Educational Crossword Puzzles
- arxiv url: http://arxiv.org/abs/2404.06186v1
- Date: Tue, 9 Apr 2024 10:12:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 15:09:49.602391
- Title: Clue-Instruct: Text-Based Clue Generation for Educational Crossword Puzzles
- Title(参考訳): Clue-Instruct: 教育用クロスワードパズルのためのテキストベースのクローズ生成
- Authors: Andrea Zugarini, Kamyar Zeinalipour, Surya Sai Kadali, Marco Maggini, Marco Gori, Leonardo Rigutini,
- Abstract要約: 本稿では,大規模言語モデルの構築に活用可能な,教育用手掛かり生成データセットの構築手法を提案する。
関連するキーワードに関連する情報的コンテンツをウィキペディアページから集めることで、大言語モデルを用いて、教育的手がかりを自動的に生成する。
我々は、与えられた入力内容とキーワードから教育用手がかりを生成するために、異なるLLMを指示するためにヒントインストラクションを使用した。
- 参考スコア(独自算出の注目度): 10.375451846093327
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Crossword puzzles are popular linguistic games often used as tools to engage students in learning. Educational crosswords are characterized by less cryptic and more factual clues that distinguish them from traditional crossword puzzles. Despite there exist several publicly available clue-answer pair databases for traditional crosswords, educational clue-answer pairs datasets are missing. In this article, we propose a methodology to build educational clue generation datasets that can be used to instruct Large Language Models (LLMs). By gathering from Wikipedia pages informative content associated with relevant keywords, we use Large Language Models to automatically generate pedagogical clues related to the given input keyword and its context. With such an approach, we created clue-instruct, a dataset containing 44,075 unique examples with text-keyword pairs associated with three distinct crossword clues. We used clue-instruct to instruct different LLMs to generate educational clues from a given input content and keyword. Both human and automatic evaluations confirmed the quality of the generated clues, thus validating the effectiveness of our approach.
- Abstract(参考訳): クロスワードパズル(Crossword puzzles)は、学生が学習に携わるツールとしてよく使われる人気のある言語ゲームである。
教育用クロスワードは、伝統的なクロスワードパズルと区別する、より暗号化され、より現実的な手がかりによって特徴づけられる。
従来のクロスワード用のシークエンス・アンサー・ペア・データベースはいくつか存在するが、教育用シークエンス・アンサー・ペア・データセットは欠落している。
本稿では,Large Language Models (LLM) の教育用手掛かり生成データセットを構築する手法を提案する。
ウィキペディアページから関連キーワードに関連する情報的コンテンツを集めることで、Large Language Modelsを使用して、与えられた入力キーワードとそのコンテキストに関連する教育的手がかりを自動的に生成する。
このようなアプローチにより、3つの異なるクロスワード手がかりに関連付けられたテキストキーワードペアを持つ44,075個のユニークな例を含むデータセットであるインストラクションを作成した。
我々は、与えられた入力内容とキーワードから教育用手がかりを生成するために、異なるLLMを指示するためにヒントインストラクションを使用した。
人的評価と自動評価の両方が生成した手がかりの品質を確認し,提案手法の有効性を検証した。
関連論文リスト
- Harnessing LLMs for Educational Content-Driven Italian Crossword Generation [10.137657521054356]
我々は,イタリア語のクロスワードパズルをテキストから生成するための新しいツールを公開した。
我々は、GPT-4o、Mistral-7B-Instruct-v0.3、Llama3-8b-Instructといった先進言語モデルを用いている。
この最先端ジェネレータは、包括的なイタリア・クルー・インストラクトデータセットを使用する。
論文 参考訳(メタデータ) (2024-11-25T21:13:25Z) - Italian Crossword Generator: Enhancing Education through Interactive
Word Puzzles [9.84767617576152]
我々はクロスワードの手がかりを生成し検証するための総合システムを開発した。
モデルを微調整するために、ヒントと答えのペアのデータセットがコンパイルされた。
与えられたテキストからクロスワードの手がかりを生成するために、ゼロ/フォーショット学習技術が用いられた。
論文 参考訳(メタデータ) (2023-11-27T11:17:29Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Storyfier: Exploring Vocabulary Learning Support with Text Generation
Models [52.58844741797822]
本研究では,学習者の興味をひく対象語に対するコヒーレントな文脈を提供するために,Storyfierを開発した。
学習者は一般的に、生成したストーリーを目標語を接続し、学習負荷を緩和するための支援を書くのに好む。
読み書き学習セッションでは、AI機能のないベースラインツールで学習するよりも、Storyfierを使用する参加者は、リコールやターゲット語の使用でパフォーマンスが悪くなります。
論文 参考訳(メタデータ) (2023-08-07T18:25:00Z) - Multiview Identifiers Enhanced Generative Retrieval [78.38443356800848]
生成検索は、検索対象の通路の識別子文字列を生成する。
本稿では,パスの内容に基づいて生成される新しいタイプの識別子,合成識別子を提案する。
提案手法は生成的検索において最善を尽くし,その有効性とロバスト性を実証する。
論文 参考訳(メタデータ) (2023-05-26T06:50:21Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Down and Across: Introducing Crossword-Solving as a New NLP Benchmark [11.194615436370507]
25年にわたるニューヨーク・タイムズの日刊クロスワードから収集したクロスワードパズルのコーパスの仕様を公表する。
これらのパズルには、歴史的、事実的、単語の意味、同義語/匿名、補足語、略語、接頭辞/接頭辞、単語プレイ、言語横断の様々な手がかりが含まれている。
論文 参考訳(メタデータ) (2022-05-20T21:16:44Z) - On the Efficiency of Integrating Self-supervised Learning and
Meta-learning for User-defined Few-shot Keyword Spotting [51.41426141283203]
ユーザ定義キーワードスポッティングは、ユーザが定義する新しい音声用語を検出するタスクである。
これまでの研究は、自己教師付き学習モデルを取り入れたり、メタ学習アルゴリズムを適用しようとするものだった。
この結果から,HuBERTとMatching Networkを組み合わせることで,最適な結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-04-01T10:59:39Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Decrypting Cryptic Crosswords: Semantically Complex Wordplay Puzzles as
a Target for NLP [5.447716844779342]
クリプティック・クロスワード(Cryptic crosswords)は、イギリスにおける英語を話すクロスワードである。
ベンチマークとして使用可能な暗号クロスワードヒントのデータセットを提示し,それらを解決するためにシーケンス・ツー・シーケンスモデルをトレーニングする。
新たなカリキュラム学習手法により,性能を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2021-04-17T18:54:00Z) - Few-Shot Keyword Spotting With Prototypical Networks [3.6930948691311016]
キーワードスポッティングは、AmazonのAlexaやGoogle Homeなど、多くの音声インターフェースで広く使用されている。
まず、この問題を数発のキーワードスポッティングとして定式化し、メートル法学習を用いてアプローチする。
そこで我々は,ネットワーク上の時間的および拡張的畳み込みを用いたプロトタイプ的な数ショットキーワードスポッティング問題に対する解を提案する。
論文 参考訳(メタデータ) (2020-07-25T20:17:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。