論文の概要: Can LLMs Solve and Generate Linguistic Olympiad Puzzles?
- arxiv url: http://arxiv.org/abs/2509.21820v1
- Date: Fri, 26 Sep 2025 03:26:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.155361
- Title: Can LLMs Solve and Generate Linguistic Olympiad Puzzles?
- Title(参考訳): LLMは言語性オリンパ管の解法と生成を可能か?
- Authors: Neh Majmudar, Elena Filatova,
- Abstract要約: 我々は,高校生を対象とした言語オリンピアードのパズルに着目した。
本稿では,Large Language Models (LLM) を用いた言語パズルの解法について検討する。
パズル解法実験から得られた知見を用いて,パズル生成の新たな課題を導出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce a combination of novel and exciting tasks: the solution and generation of linguistic puzzles. We focus on puzzles used in Linguistic Olympiads for high school students. We first extend the existing benchmark for the task of solving linguistic puzzles. We explore the use of Large Language Models (LLMs), including recent state-of-the-art models such as OpenAI's o1, for solving linguistic puzzles, analyzing their performance across various linguistic topics. We demonstrate that LLMs outperform humans on most puzzles types, except for those centered on writing systems, and for the understudied languages. We use the insights from puzzle-solving experiments to direct the novel task of puzzle generation. We believe that automating puzzle generation, even for relatively simple puzzles, holds promise for expanding interest in linguistics and introducing the field to a broader audience. This finding highlights the importance of linguistic puzzle generation as a research task: such puzzles can not only promote linguistics but also support the dissemination of knowledge about rare and understudied languages.
- Abstract(参考訳): 本稿では,言語パズルの解法と生成という,新しい課題とエキサイティングな課題の組み合わせを紹介する。
我々は,高校生を対象とした言語オリンピアードのパズルに着目した。
まず,言語パズルの解き方について,既存のベンチマークを拡張した。
我々は,OpenAIのo1のような最近の最先端モデルを含むLarge Language Models (LLMs) を,言語パズルの解法,言語トピック間のパフォーマンス解析に活用することを検討した。
我々は,LLMが,書記システムを中心とした言語や下層言語を除き,ほとんどのパズル型において人間よりも優れていたことを実証した。
パズル解法実験から得られた知見を用いて,パズル生成の新たな課題を導出する。
比較的単純なパズルであっても、自動パズル生成は言語学への関心を拡大し、広い聴衆にその分野を導入することを約束していると我々は信じている。
この発見は、研究課題としての言語パズル生成の重要性を強調している。そのようなパズルは、言語学を促進できるだけでなく、稀で未研究の言語に関する知識の普及を支援することができる。
関連論文リスト
- UNVEILING: What Makes Linguistics Olympiad Puzzles Tricky for LLMs? [9.874680131703467]
大規模言語モデル(LLM)は推論タスクの可能性を示しているが、言語学パズルにおけるそれらの性能はいまだに貧弱である。
本研究は,低リソース言語41言語を対象に,LLMの629問題に対する性能を言語情報付きでラベル付けして解析し,弱点を明らかにした。
論文 参考訳(メタデータ) (2025-08-15T06:53:28Z) - Puzzled by Puzzles: When Vision-Language Models Can't Take a Hint [57.73346054360675]
画像、空間配置、記号置換を通じて言語を符号化するリバスパズルは、現在の視覚言語モデル(VLM)に固有の課題をもたらす。
本稿では,現代VLMにおけるレバスパズルの解釈と解決の能力について,多種多様な英語リバスパズルの手書きおよび注釈付きベンチマークを構築して検討する。
論文 参考訳(メタデータ) (2025-05-29T17:59:47Z) - Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.51318974970985]
自然言語でパズルを解くことは、AIにおける長年の課題である。
本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。
動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文 参考訳(メタデータ) (2025-05-22T01:37:40Z) - Making New Connections: LLMs as Puzzle Generators for The New York Times' Connections Word Game [6.136654326170453]
コネクションパズル(Connections puzzle)は、ニューヨーク・タイムズ(NYT)が毎日発行しているワードアソシエーションゲームである。
新たなパズルを生成するには、メタ認知の形式が必要である: ジェネレータは、潜在的な解決者の下流の推論を正確にモデル化できなければならない。
この結果から,LLMは有能なパズル作成者であり,人間によって判断されるような,楽しい,挑戦的な,創造的なコネクトパズルを多種多様なセットで生成できることがわかった。
論文 参考訳(メタデータ) (2024-07-15T21:05:25Z) - Are Language Models Puzzle Prodigies? Algorithmic Puzzles Unveil Serious
Challenges in Multimodal Reasoning [24.386388107656334]
本稿では,視覚的質問応答の文脈内での多モーダルパズル解決の新たな課題を紹介する。
本稿では,アルゴリズムパズルの解法におけるマルチモーダル言語モデルの能力に挑戦し,評価するための新しいデータセットAlgoVQAを提案する。
論文 参考訳(メタデータ) (2024-03-06T17:15:04Z) - How do Large Language Models Handle Multilingualism? [81.15060972112563]
本研究では,大規模言語モデル(LLM)が多言語モデルをどのように扱うかを検討する。
LLMはまずクエリを理解し、タスク解決のために多言語入力を英語に変換する。
中間層では、英語を思考に用い、自己意識とフィードフォワード構造を持つ多言語知識を取り入れている。
論文 参考訳(メタデータ) (2024-02-29T02:55:26Z) - Automated Graph Genetic Algorithm based Puzzle Validation for Faster
Game Desig [69.02688684221265]
本稿では,コンピュータゲームにおける論理パズルを効率的に解くための進化的アルゴリズムを提案する。
制約満足度問題に対するハイブリッド遺伝的アプローチの様々なバリエーションについて論じる。
論文 参考訳(メタデータ) (2023-02-17T18:15:33Z) - PuzzLing Machines: A Challenge on Learning From Small Data [64.513459448362]
我々は,高校生を対象としたLinguistic OlympiadsのRosetta StoneパズルからなるPuzzLing Machinesという,小さなデータから学ぶための課題を紹介した。
私たちのチャレンジには、81言語から幅広い言語現象をカバーする約100のパズルが含まれています。
単純な統計アルゴリズムと最先端のディープニューラルモデルの両方が、予想通り、この課題に対して不十分に実行可能であることを示す。
論文 参考訳(メタデータ) (2020-04-27T20:34:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。