論文の概要: Riddle Quest : The Enigma of Words
- arxiv url: http://arxiv.org/abs/2601.19273v1
- Date: Tue, 27 Jan 2026 07:03:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.214493
- Title: Riddle Quest : The Enigma of Words
- Title(参考訳): リドルクエスト : 言葉の謎
- Authors: Niharika Sri Parasa, Chaitali Diwan, Srinath Srinivasa,
- Abstract要約: 類推に基づく謎の作成と評価を行うための簡単なパイプラインを導入する。
このシステムには、コンセプトに関する構造化された事実を構築する3つのクリエーター、類似に有用な属性を選択するセマンティックマッパー、そしてそれらを謎の手がかりに変えるスタイリングされたジェネレータが含まれる。
- 参考スコア(独自算出の注目度): 2.523415604068924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Riddles are concise linguistic puzzles that describe an object or idea through indirect, figurative, or playful clues. They are a longstanding form of creative expression, requiring the solver to interpret hints, recognize patterns, and draw inferences to identify the answers. In this work, we introduce a simple pipeline for creating and evaluating analogy-based riddles. The system includes a triples creator that builds structured facts about a concept, a semantic mapper that selects attributes useful for analogy, a stylized generator that turns them into riddle clues, and a validator that collects all possible answers the riddle could point to. We use this validator to study whether large language models can recover the full answer set for different riddle types. Our case study shows that while models often guess the main intended answer, they frequently miss other valid interpretations. This highlights the value of riddles as a lightweight tool for examining reasoning coverage and ambiguity handling in language models.
- Abstract(参考訳): リドル(英: Riddles)は、間接的、図形的、または遊び心のある手がかりを通して、物体やアイデアを記述する簡潔な言語パズルである。
それらは長年続く創造的な表現であり、解答者はヒントを解釈し、パターンを認識し、答えを識別するために推論を引き出す必要がある。
本研究では,類推に基づく謎の作成と評価を行うための簡単なパイプラインを提案する。
このシステムには、概念に関する構造化された事実を構築するトリプルスクリエーター、アナロジーに有用な属性を選択するセマンティックマッパー、それらを謎の手がかりに変えるスタイル化されたジェネレータ、そして、その謎が示す可能性のあるすべての答えを収集するバリデータが含まれている。
我々はこの検証器を用いて、大きな言語モデルが様々な解法型に対して完全な解集合を復元できるかどうかを検証している。
我々のケーススタディでは、モデルが主目的の答えを推測することが多いが、他の有効な解釈を見逃すことが多い。
このことは、言語モデルにおける推論カバレッジとあいまいさの扱いを調べるための軽量ツールとして、godlesの価値を強調している。
関連論文リスト
- Puzzled by Puzzles: When Vision-Language Models Can't Take a Hint [57.73346054360675]
画像、空間配置、記号置換を通じて言語を符号化するリバスパズルは、現在の視覚言語モデル(VLM)に固有の課題をもたらす。
本稿では,現代VLMにおけるレバスパズルの解釈と解決の能力について,多種多様な英語リバスパズルの手書きおよび注釈付きベンチマークを構築して検討する。
論文 参考訳(メタデータ) (2025-05-29T17:59:47Z) - Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.51318974970985]
自然言語でパズルを解くことは、AIにおける長年の課題である。
本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。
動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文 参考訳(メタデータ) (2025-05-22T01:37:40Z) - Liar, Liar, Logical Mire: A Benchmark for Suppositional Reasoning in Large Language Models [25.732397636695882]
我々は騎士とナイフパズルの原理に基づく仮定推論のベンチマークである$textitTruthQuest$を紹介した。
評価の結果、Llama 3やMixtral-8x7Bのような大規模言語モデルはこれらのタスクを解くのにかなりの困難を呈している。
論文 参考訳(メタデータ) (2024-06-18T12:24:22Z) - CC-Riddle: A Question Answering Dataset of Chinese Character Riddles [51.41044750575767]
漢字のリドルは、中国語特有の文化芸能の一形態である。
CC-Riddle という名前の textbf Chinese textbfCharacter riddle データセットを構築した。
論文 参考訳(メタデータ) (2022-06-28T06:23:13Z) - BiRdQA: A Bilingual Dataset for Question Answering on Tricky Riddles [82.63394952538292]
バイリンガル質問応答データセットであるBiRdQAを導入する。
既存のモノリンガルQAモデルとマルチリンガルQAモデルは、我々のデータセットではうまく機能せず、機械が難解な謎を解くために人間を倒すには長い道のりがあることを示している。
論文 参考訳(メタデータ) (2021-09-23T00:46:47Z) - RiddleSense: Answering Riddle Questions as Commonsense Reasoning [35.574564653690594]
RiddleSenseは、高階コモンセンス推論モデルをベンチマークするための新しい複数選択質問回答チャレンジである。
riddlesenseは、リドルスタイルのコモンセンス質問応答のための、最初の大規模なデータセットである。
我々は,様々な推論モデルを体系的に評価し,最高の教師付きモデルと人間のパフォーマンスの間には大きなギャップがあることを指摘した。
論文 参考訳(メタデータ) (2021-01-02T05:28:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。