論文の概要: Riddle Quest : The Enigma of Words
- arxiv url: http://arxiv.org/abs/2601.19273v1
- Date: Tue, 27 Jan 2026 07:03:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.214493
- Title: Riddle Quest : The Enigma of Words
- Title(参考訳): リドルクエスト : 言葉の謎
- Authors: Niharika Sri Parasa, Chaitali Diwan, Srinath Srinivasa,
- Abstract要約: 類推に基づく謎の作成と評価を行うための簡単なパイプラインを導入する。
このシステムには、コンセプトに関する構造化された事実を構築する3つのクリエーター、類似に有用な属性を選択するセマンティックマッパー、そしてそれらを謎の手がかりに変えるスタイリングされたジェネレータが含まれる。
- 参考スコア(独自算出の注目度): 2.523415604068924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Riddles are concise linguistic puzzles that describe an object or idea through indirect, figurative, or playful clues. They are a longstanding form of creative expression, requiring the solver to interpret hints, recognize patterns, and draw inferences to identify the answers. In this work, we introduce a simple pipeline for creating and evaluating analogy-based riddles. The system includes a triples creator that builds structured facts about a concept, a semantic mapper that selects attributes useful for analogy, a stylized generator that turns them into riddle clues, and a validator that collects all possible answers the riddle could point to. We use this validator to study whether large language models can recover the full answer set for different riddle types. Our case study shows that while models often guess the main intended answer, they frequently miss other valid interpretations. This highlights the value of riddles as a lightweight tool for examining reasoning coverage and ambiguity handling in language models.
- Abstract(参考訳): リドル(英: Riddles)は、間接的、図形的、または遊び心のある手がかりを通して、物体やアイデアを記述する簡潔な言語パズルである。
それらは長年続く創造的な表現であり、解答者はヒントを解釈し、パターンを認識し、答えを識別するために推論を引き出す必要がある。
本研究では,類推に基づく謎の作成と評価を行うための簡単なパイプラインを提案する。
このシステムには、概念に関する構造化された事実を構築するトリプルスクリエーター、アナロジーに有用な属性を選択するセマンティックマッパー、それらを謎の手がかりに変えるスタイル化されたジェネレータ、そして、その謎が示す可能性のあるすべての答えを収集するバリデータが含まれている。
我々はこの検証器を用いて、大きな言語モデルが様々な解法型に対して完全な解集合を復元できるかどうかを検証している。
我々のケーススタディでは、モデルが主目的の答えを推測することが多いが、他の有効な解釈を見逃すことが多い。
このことは、言語モデルにおける推論カバレッジとあいまいさの扱いを調べるための軽量ツールとして、godlesの価値を強調している。
関連論文リスト
- A Reasoning-Based Approach to Cryptic Crossword Clue Solving [0.18416014644193066]
この研究は、オープンライセンスコンポーネントから構築されたLLMベースの推論システムについて述べる。
i) 解答の仮説, (ii) 語句説明の提案, (iii) 体系化された推論ステップで動作する検証システムを用いて, 秘密の手がかりを解く。
全体として、このシステムは、イギリスのThe TimesやThe Telegraphの新聞から得た手がかりの、挑戦的なCryptoniteデータセット上で、最先端のパフォーマンスを確立している。
論文 参考訳(メタデータ) (2025-06-05T09:43:28Z) - Puzzled by Puzzles: When Vision-Language Models Can't Take a Hint [57.73346054360675]
画像、空間配置、記号置換を通じて言語を符号化するリバスパズルは、現在の視覚言語モデル(VLM)に固有の課題をもたらす。
本稿では,現代VLMにおけるレバスパズルの解釈と解決の能力について,多種多様な英語リバスパズルの手書きおよび注釈付きベンチマークを構築して検討する。
論文 参考訳(メタデータ) (2025-05-29T17:59:47Z) - Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.51318974970985]
自然言語でパズルを解くことは、AIにおける長年の課題である。
本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。
動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文 参考訳(メタデータ) (2025-05-22T01:37:40Z) - Liar, Liar, Logical Mire: A Benchmark for Suppositional Reasoning in Large Language Models [25.732397636695882]
我々は騎士とナイフパズルの原理に基づく仮定推論のベンチマークである$textitTruthQuest$を紹介した。
評価の結果、Llama 3やMixtral-8x7Bのような大規模言語モデルはこれらのタスクを解くのにかなりの困難を呈している。
論文 参考訳(メタデータ) (2024-06-18T12:24:22Z) - Language Models can be Logical Solvers [99.40649402395725]
論理解法の推論過程を直接エミュレートする新しい言語モデルであるLoGiPTを導入する。
LoGiPTは、導出的ソルバの見えない推論過程を明らかにして精錬することから導かれる、新しく構築された命令チューニングデータセットに基づいて微調整される。
論文 参考訳(メタデータ) (2023-11-10T16:23:50Z) - CC-Riddle: A Question Answering Dataset of Chinese Character Riddles [51.41044750575767]
漢字のリドルは、中国語特有の文化芸能の一形態である。
CC-Riddle という名前の textbf Chinese textbfCharacter riddle データセットを構築した。
論文 参考訳(メタデータ) (2022-06-28T06:23:13Z) - BiRdQA: A Bilingual Dataset for Question Answering on Tricky Riddles [82.63394952538292]
バイリンガル質問応答データセットであるBiRdQAを導入する。
既存のモノリンガルQAモデルとマルチリンガルQAモデルは、我々のデータセットではうまく機能せず、機械が難解な謎を解くために人間を倒すには長い道のりがあることを示している。
論文 参考訳(メタデータ) (2021-09-23T00:46:47Z) - Discrete Reasoning Templates for Natural Language Understanding [79.07883990966077]
我々は,複雑な質問をより単純な質問に分解する手法を提案する。
事前定義された推論テンプレートの指示に従って最終回答を導出する。
我々のアプローチは、解釈可能でありながら最先端技術と競合し、監督をほとんど必要としないことを示す。
論文 参考訳(メタデータ) (2021-04-05T18:56:56Z) - RiddleSense: Answering Riddle Questions as Commonsense Reasoning [35.574564653690594]
RiddleSenseは、高階コモンセンス推論モデルをベンチマークするための新しい複数選択質問回答チャレンジである。
riddlesenseは、リドルスタイルのコモンセンス質問応答のための、最初の大規模なデータセットである。
我々は,様々な推論モデルを体系的に評価し,最高の教師付きモデルと人間のパフォーマンスの間には大きなギャップがあることを指摘した。
論文 参考訳(メタデータ) (2021-01-02T05:28:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。