Fugu-MT 論文翻訳(概要): LogiNumSynth: Synthesizing Joint Logical-Numerical Reasoning Problems for Language Models

論文の概要: LogiNumSynth: Synthesizing Joint Logical-Numerical Reasoning Problems for Language Models

arxiv url: http://arxiv.org/abs/2510.11031v1
Date: Mon, 13 Oct 2025 06:01:02 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-14 18:06:30.215891
Title: LogiNumSynth: Synthesizing Joint Logical-Numerical Reasoning Problems for Language Models
Title（参考訳）: LogiNumSynth:言語モデルにおける共同論理-数値推論問題の合成
Authors: Yiwei Liu, Yucheng Li, Xiao Li, Gong Cheng,
Abstract要約: LogiNum Synthは、共同論理的推論において習熟を必要とするタスクを合成する自然言語問題シンセサイザーである。推論の世界豊かさ、論理的推論深度、数値計算の複雑さに対するきめ細かい制御をサポートする。診断ツールと、統合推論スキルの進歩のための目標監督のソースの両方として機能する。
参考スコア（独自算出の注目度）: 14.833385574931855
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Joint logical-numerical reasoning remains a major challenge for language models, yet existing datasets rely on fixed rule sets and offer limited control over task complexity, constraining their generalizability for evaluation and training. We present LogiNumSynth, a flexible natural language problem synthesizer that synthesizes tasks requiring proficiency in joint logical reasoning (e.g., rule-based reasoning) and numerical reasoning (e.g., arithmetic computation). LogiNumSynth supports fine-grained control over reasoning world richness, logical reasoning depth, and the complexity of numerical computations, enabling flexible data synthesis across difficulty levels. We demonstrate three key contributions: (1) Synthesizer -- synthesizing fully controllable joint reasoning tasks over natural language; (2) Evaluation & Process Analysis -- evaluating both process accuracy and answer accuracy; (3) Targeted Training -- using synthesized data to enhance LLMs' reasoning performance. Experiments with multiple LLMs highlight persistent weaknesses in logical-numerical reasoning, showing that LogiNumSynth can serve as both a diagnostic tool and a source of targeted supervision for advancing integrated reasoning skills.
Abstract（参考訳）: しかし、既存のデータセットは一定のルールセットに依存し、タスクの複雑さを限定的に制御し、評価とトレーニングの一般化性を制限している。本稿では,論理的論理的推論(例えば規則に基づく推論)と数値的推論(例えば算術計算)において習熟を必要とするタスクを合成する,フレキシブルな自然言語問題合成器であるLogiNumSynthを提案する。 LogiNumSynthは、推論の世界豊かさ、論理的推論深度、数値計算の複雑さに対するきめ細かい制御をサポートし、難易度にわたって柔軟なデータ合成を可能にする。本研究では,(1) 自然言語による完全制御可能な共同推論タスクの合成,(2) プロセス精度と解答精度の両方を評価する評価とプロセス分析,(3) LLMの推論性能を高めるために合成データを用いた目標学習,の3つの重要な貢献について述べる。複数のLSMを用いた実験では、論理的推論において永続的な弱点が強調され、LogiNumSynthが診断ツールと統合推論スキルを進化させるターゲット管理のソースの両方として機能できることが示されている。

論文の概要: LogiNumSynth: Synthesizing Joint Logical-Numerical Reasoning Problems for Language Models

関連論文リスト