Fugu-MT 論文翻訳(概要): Markov Chain of Thought for Efficient Mathematical Reasoning

論文の概要: Markov Chain of Thought for Efficient Mathematical Reasoning

arxiv url: http://arxiv.org/abs/2410.17635v2
Date: Thu, 06 Mar 2025 06:39:56 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-07 17:59:00.463639
Title: Markov Chain of Thought for Efficient Mathematical Reasoning
Title（参考訳）: 効率的な数学的推論のための思考のマルコフ連鎖
Authors: Wen Yang, Minpeng Liao, Kai Fan,
Abstract要約: 多段階の思考の連鎖(CoT)は、推論ステップとタスク固有のアクションの論理構造から恩恵を受ける。我々は、標準多段階CoTを思考のマルコフ連鎖(MCoT)として概念化する。我々のMCoTは、従来の推論ステップを単純化した質問に圧縮し、効率的な次ステップ推論を可能にすることを目的としている。
参考スコア（独自算出の注目度）: 10.678633785012691
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Chain of Thought (CoT) of multi-step benefits from the logical structure of the reasoning steps and task-specific actions, significantly enhancing the mathematical reasoning capabilities of large language models. As the prevalence of long CoT, the number of reasoning steps exceeds manageable token limits and leads to higher computational demands. Inspired by the fundamental logic of human cognition, "derive, then reduce", we conceptualize the standard multi-step CoT as a novel Markov Chain of Thought (MCoT). In this study, we consider the mathematical reasoning task, defining each reasoning step as text accompanied by a Python code snippet. To facilitate a longer reasoning path, self-correction is enabled through interactions with the code interpreter. Our MCoT aims to compress previous reasoning steps into a simplified question, enabling efficient next-step inference without relying on a lengthy KV cache. In our experiments, we curate the $\texttt{MCoTInstruct}$ dataset, and the empirical results indicate that MCoT not only significantly enhances efficiency but also maintains comparable accuracy. While much remains to be explored, this work paves the way for exploring the long CoT reasoning abilities of LLMs. The code is available at https://github.com/james-yw/Markov-Chain-of-Thought
Abstract（参考訳）: 多段階の思考の連鎖(CoT)は、推論ステップとタスク固有の行動の論理的構造から恩恵を受け、大きな言語モデルの数学的推論能力を大幅に向上させた。長いCoTが出現するにつれて、推論ステップの数は管理可能なトークン制限を超え、より高い計算要求をもたらす。人間の認知の基本的論理である「派生し、還元する」に触発された我々は、標準的な多段階のCoTを、思考のマルコフ連鎖(MCoT)として概念化した。本研究では,Pythonのコードスニペットを伴って各推論ステップをテキストとして定義する数学的推論タスクについて考察する。より長い推論パスを容易にするため、コードインタプリタとのインタラクションを通じて自己訂正が可能である。我々のMCoTは、従来の推論ステップを単純化された質問に圧縮することを目的としており、長いKVキャッシュに頼ることなく、効率的な次ステップ推論を可能にしている。実験では、$\texttt{MCoTInstruct}$データセットをキュレートし、MCoTが効率を著しく向上するだけでなく、同等の精度を維持していることを示す。まだまだ多くの研究が続けられているが、この研究はLLMの長いCoT推論能力の探求の道を開くものである。コードはhttps://github.com/james-yw/Markov-Chain-of-Thoughtで公開されている。

関連論文リスト

Adaptive Deep Reasoning: Triggering Deep Thinking When Needed [28.575411507835973]
大規模言語モデル(LLM)は、ロングチェーン推論による複雑なタスクの処理において、優れた機能を示している。本稿では,問題複雑性に基づいて,短鎖と長鎖の推論チェーンを自律的に切り替える手法を提案する。この進歩は、現実世界の応用のための大規模言語モデルにおける推論の実践性を高める。
論文参考訳（メタデータ） (2025-05-26T15:08:51Z)
Fractured Chain-of-Thought Reasoning [61.647243580650446]
完全CoTと解のみのサンプリングを補間する統合推論時間戦略であるフラクチャードサンプリングを導入する。フラクチャードサンプリングは、Pass@kとトークンの予算に対して、急激なログ線形スケーリングゲインをもたらすため、優れた精度とコストのトレードオフを一貫して達成できることを示す。
論文参考訳（メタデータ） (2025-05-19T11:30:41Z)
Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching [60.04718679054704]
我々は,新しいプロンプトフレームワークであるSketch-of-Thought(SoT)を紹介する。認知に触発された推論パラダイムと言語制約を組み合わせることでトークンの使用を最小化する。 SoTは、無視できる精度の影響でトークンを76%削減する。
論文参考訳（メタデータ） (2025-03-07T06:57:17Z)
How Well do LLMs Compress Their Own Chain-of-Thought? A Token Complexity Approach [4.055489363682199]
推論長とモデル性能の関係について,最初の系統的研究を行った。このトレードオフは、非常に明確な推論チェーンにまたがって持続することを示す。提案手法は, 理論的な限界から遠く離れていることを示す。
論文参考訳（メタデータ） (2025-03-03T03:48:20Z)
Chain of Draft: Thinking Faster by Writing Less [37.492654173517046]
Chain of Draft (CoD)は、人間の認知プロセスにインスパイアされた新しいパラダイムである。 CoDはタスクを解きながら最小限だが情報的中間推論出力を生成する。
論文参考訳（メタデータ） (2025-02-25T19:36:06Z)
When More is Less: Understanding Chain-of-Thought Length in LLMs [53.77747102201451]
CoT推論は大規模言語モデル(LLM)の多段階推論能力を高めるしかし、ほとんどのモデルやタスクでは、CoT長の増加は一貫して推論精度の向上につながりますか? 本稿では, 推論ステップの数が増加するにつれて, 性能は向上するが, 最終的には低下する,というニュアンスな関係を観察する。
論文参考訳（メタデータ） (2025-02-11T05:28:59Z)
Efficient Reasoning with Hidden Thinking [48.96945580741641]
CoT(Chain-of-Thought)推論は、複雑な問題解決能力を改善するための強力なフレームワークになっています。我々は,隠された潜在空間におけるCoTの推論を利用した効率的な推論フレームワークであるtextbfHeima$(隠されたラマとして)を提案する。ハイマモデルは、ゼロショットタスクの精度を維持しつつ、より高い生成効率を達成する。
論文参考訳（メタデータ） (2025-01-31T15:10:29Z)
Training Large Language Models to Reason in a Continuous Latent Space [84.5618790930725]
我々は,制約のない潜在空間における大規模言語モデル(LLM)推論の可能性を探るため,新しいパラダイムであるCoconut (Chain of Continuous Thought)を導入する。実験により、ココナッツはいくつかの推論タスクにおいてLLMを効果的に増強できることが示されている。これらの知見は、潜伏推論の可能性を実証し、将来の研究に価値ある洞察を与える。
論文参考訳（メタデータ） (2024-12-09T18:55:56Z)
To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning [55.52872152909785]
Chain-of-Thought (CoT) は,大規模言語モデル (LLM) から推論能力を引き出すデファクト手法である。私たちは、CoTが主に数学や論理学を含むタスクに強いパフォーマンス上の利点をもたらし、他のタスクよりもはるかに少ない利益をもたらすことを示しています。
論文参考訳（メタデータ） (2024-09-18T17:55:00Z)
Break the Chain: Large Language Models Can be Shortcut Reasoners [18.047917626825548]
CoT(Chain-of-Thought)推論は複雑なモジュールを利用するが、高いトークン消費、適用可能性の制限、思考上の課題によって妨げられる。本稿では、複雑な論理的および常識的推論タスクを含む算術を超えて、CoTプロンプトの批判的評価を行う。そこで我々は,「チェーンを破る」戦略を通じて,人型やショートカットを言語モデル(LM)に統合することを提案する。
論文参考訳（メタデータ） (2024-06-04T14:02:53Z)
Mitigating Misleading Chain-of-Thought Reasoning with Selective Filtering [59.495717939664246]
大規模言語モデルは、複雑な問題を解くためにチェーン・オブ・ソート(CoT)推論技術を活用することで、顕著な能力を示した。本稿では,選択フィルタリング推論(SelF-Reasoner)と呼ばれる新しい手法を提案する。 SelF-ReasonerはScienceQA、ECQA、LastLetterタスクに対して、微調整されたT5ベースラインを一貫して改善する。
論文参考訳（メタデータ） (2024-03-28T06:28:35Z)
Chain-of-Thought Reasoning Without Prompting [40.92854235219315]
CoT推論パスは、テキストデコーディングプロセスを変更するだけで、事前訓練された言語モデルから引き出すことができる。復号経路におけるCoTの存在は、モデルの復号解に対する高い信頼と相関する。
論文参考訳（メタデータ） (2024-02-15T18:55:41Z)
The Impact of Reasoning Step Length on Large Language Models [40.546685248243534]
思考の連鎖(CoT)は、大きな言語モデルの推論能力を改善する上で重要である。プロンプトにおけるCoTの有効性と推論ステップの長さの相関について検討した。
論文参考訳（メタデータ） (2024-01-10T04:37:38Z)
Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models [56.34029644009297]
大規模言語モデル(LLM)は、形式的知識表現(KR)システムの様々な制限を克服する能力を示した。 LLMは誘導的推論において最も優れているが、誘導的推論では最も効果が低い。モデルの性能を評価するため,シングルタスクトレーニング,マルチタスクトレーニング,および「チェーンオブ思考」知識蒸留細調整技術について検討した。
論文参考訳（メタデータ） (2023-10-02T01:00:50Z)
Boosting Language Models Reasoning with Chain-of-Knowledge Prompting [18.326858925174605]
CoK(Chain-of-Knowledge)は、構造三重の形で明確な知識証拠を引き出すことを目的としている。さらに, 推論チェーンの信頼性を推定するF2-Verification法を導入する。広汎な実験により,本手法はコモンセンス,事実,記号,算術的推論タスクの性能をさらに向上させることができることが示された。
論文参考訳（メタデータ） (2023-06-10T12:42:36Z)
Beyond Chain-of-Thought, Effective Graph-of-Thought Reasoning in Language Models [74.40196814292426]
本稿では,人間の思考過程をチェーンとしてだけでなく,グラフとしてモデル化するグラフ・オブ・ソート(GoT)推論を提案する。 GoTは人間の思考の連続しない性質を捉え、思考プロセスのより現実的なモデリングを可能にします。テキストのみの推論タスクとマルチモーダル推論タスクでGoTの性能を評価する。
論文参考訳（メタデータ） (2023-05-26T02:15:09Z)
Towards Understanding Chain-of-Thought Prompting: An Empirical Study of What Matters [82.84696222087396]
CoT(Chain-of-Thought)の促進により,大規模言語モデル(LLM)の多段階推論能力が劇的に向上する無効な実演でもCoT推論が可能であることを示す。
論文参考訳（メタデータ） (2022-12-20T05:20:54Z)
Chaining Simultaneous Thoughts for Numerical Reasoning [92.2007997126144]
テキストによる数値推論は、AIシステムにとって不可欠なスキルであるべきです。これまでの研究は方程式の構造をモデル化することに集中し、様々な構造化デコーダを提案してきた。我々は、有向非巡回グラフを用いてステップを推論する数値推論器CANTORを提案する。
論文参考訳（メタデータ） (2022-11-29T18:52:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。