Fugu-MT 論文翻訳(概要): Divide-or-Conquer? Which Part Should You Distill Your LLM?

論文の概要: Divide-or-Conquer? Which Part Should You Distill Your LLM?

arxiv url: http://arxiv.org/abs/2402.15000v1
Date: Thu, 22 Feb 2024 22:28:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-26 16:06:58.357131
Title: Divide-or-Conquer? Which Part Should You Distill Your LLM?
Title（参考訳）: ディバイド・オア・コンカー? LLMはどれに浸すべきか?
Authors: Zhuofeng Wu, He Bai, Aonan Zhang, Jiatao Gu, VG Vinod Vydiswaran, Navdeep Jaitly, Yizhe Zhang
Abstract要約: 我々は、推論タスクを問題解決フェーズと問題解決フェーズに分解する同様の戦略を考案する。戦略が単一ステージソリューションより優れていることを示す。
参考スコア（独自算出の注目度）: 40.563633582127316
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent methods have demonstrated that Large Language Models (LLMs) can solve reasoning tasks better when they are encouraged to solve subtasks of the main task first. In this paper we devise a similar strategy that breaks down reasoning tasks into a problem decomposition phase and a problem solving phase and show that the strategy is able to outperform a single stage solution. Further, we hypothesize that the decomposition should be easier to distill into a smaller model compared to the problem solving because the latter requires large amounts of domain knowledge while the former only requires learning general problem solving strategies. We propose methods to distill these two capabilities and evaluate their impact on reasoning outcomes and inference cost. We find that we can distill the problem decomposition phase and at the same time achieve good generalization across tasks, datasets, and models. However, it is harder to distill the problem solving capability without losing performance and the resulting distilled model struggles with generalization. These results indicate that by using smaller, distilled problem decomposition models in combination with problem solving LLMs we can achieve reasoning with cost-efficient inference and local adaptation.
Abstract（参考訳）: 近年,Large Language Models (LLM) は,まず主課題のサブタスクを解くことを奨励された場合に,推論タスクをよりよく解けることを示した。本稿では,推論タスクを問題分解フェーズと問題解決フェーズに分解する同様の戦略を考案し,その戦略が1段階の解よりも優れていることを示す。さらに,後者は大量のドメイン知識を必要とするが,前者は一般的な問題解決戦略の学習しか必要としないため,より小さなモデルに分解を蒸留する方が容易であると仮定した。我々は,これら2つの能力を蒸留し,推論結果と推論コストに与える影響を評価する手法を提案する。問題分解フェーズを蒸留できると同時に,タスクやデータセット,モデルなどにわたって,優れた一般化を実現できることが分かりました。しかし、性能を損なわずに問題解決能力の蒸留が困難であり、結果の蒸留モデルは一般化に苦慮する。これらの結果は、より小さく蒸留された問題分解モデルと問題解決llmを組み合わせることで、コスト効率の高い推論と局所適応による推論が可能になることを示唆する。

関連論文リスト

Exploring Solution Divergence and Its Effect on Large Language Model Problem Solving [37.94354699202412]
より高度な解の発散は、様々なモデルにまたがるより良い問題解決能力に肯定的に関係していることを示す。 SFT戦略とRL戦略の両方をサポートする新しい指標として解の発散を提案する。
論文参考訳（メタデータ） (2025-09-26T15:27:50Z)
LLMs cannot spot math errors, even when allowed to peek into the solution [17.91547969168414]
本稿では,VtG と PRM800K という2つの誤り推論データセットを用いて,ステップワイズ・ソリューションにおける第1のエラーステップを特定することの課題について検討する。実験の結果, 従来のLLMでは, 参照ソリューションへのアクセスが許された場合でも, 学生ソリューションの最初のエラーステップを見つけるのに苦労していることがわかった。そこで本研究では,学生の解とより緊密に整合して,中間修正学生解を生成する手法を提案する。
論文参考訳（メタデータ） (2025-09-01T11:41:10Z)
MetaLadder: Ascending Mathematical Solution Quality via Analogical-Problem Reasoning Transfer [37.81465564673498]
大規模言語モデル(LLM)は、数学的推論タスクを解く上で有望な能力を示した。メタプロブレムのリコールとリフレクションを LLM に明示的に促すフレームワークである textbfMetaLadder を提案する。我々のMetaLadderはLLMの問題解決精度を大幅に向上させることを示す。
論文参考訳（メタデータ） (2025-03-19T04:36:35Z)
A Knapsack by Any Other Name: Presentation impacts LLM performance on NP-hard problems [64.05451567422342]
自然言語で表現されたNPハード問題の集合であるEveryday Hard Optimization Problems (EHOP) のデータセットを紹介する。 EHOPには、コンピュータサイエンスの教科書(例えば、グラフカラー化)で見られる問題の定式化が含まれている。複数のプロンプト戦略にまたがる最先端のLCMは、実生活や逆転よりも正確な教科書問題を解くことができる。
論文参考訳（メタデータ） (2025-02-19T14:39:59Z)
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs [76.43407125275202]
o1のようなモデルは、推論中に人間のような長時間の思考をエミュレートすることができる。本論文は,これらのモデルにおける過度な考察の課題に関する,最初の包括的研究である。精度を損なうことなく、過剰思考を緩和し、推論プロセスを合理化するための戦略を提案する。
論文参考訳（メタデータ） (2024-12-30T18:55:12Z)
SIKeD: Self-guided Iterative Knowledge Distillation for mathematical reasoning [49.29200323760457]
大きな言語モデル(LLM)は、推論スキルをより小さなモデルに転送することができる。より小さなモデルは蒸留時に全ての戦略にLLM分布を適合させるほど表現力に乏しい。この1つの戦略への依存は、より小さなモデルにおいて、望ましい戦略で困難な推論タスクを解決しようとするときに、課題となる。
論文参考訳（メタデータ） (2024-10-24T09:29:18Z)
Achieving >97% on GSM8K: Deeply Understanding the Problems Makes LLMs Better Solvers for Math Word Problems [50.76385564061713]
CoT(Chain-of-Thought)のプロンプトにより、さまざまな推論タスクにわたるLLM(Large Language Models)のパフォーマンスが向上した。 CoTは通常、セマンティックな誤解エラー、計算エラー、ステップミスという3つの落とし穴に悩まされる。意味的誤解の誤りに対処し,LLMの数学的問題解決能力を改善するために,DUP(Deeply Understanding the Problems)を提案する。
論文参考訳（メタデータ） (2024-04-23T12:16:05Z)
Distilling Algorithmic Reasoning from LLMs via Explaining Solution Programs [2.3020018305241337]
大きな言語モデルの推論能力を改善する効果的な方法として、明確な推論経路を蒸留する手法が登場している。本稿では, LLM から推論能力を抽出する手法を提案する。提案実験は,ReasonerがCoderによるプログラム実装をより効果的にガイドできることを示す。
論文参考訳（メタデータ） (2024-04-11T22:19:50Z)
PuzzleBench: Can LLMs Solve Challenging First-Order Combinatorial Reasoning Problems? [27.696027301600793]
本稿では,31の課題のデータセットであるPuzzleBenchについて紹介する。これらの問題は、すべて第一次、すなわち、様々な大きさの問題のインスタンスでインスタンス化でき、そのほとんどはNPハードである。まず,LLMがシンボリック・ソルバによって支援されても,データセット上ではかなり低性能であることを示す。そこで本研究では,LLMとシンボルソルバとインタプリタを組み合わせた新しいアプローチであるPuzzle-LMを提案する。
論文参考訳（メタデータ） (2024-02-04T20:56:09Z)
Small Language Models Fine-tuned to Coordinate Larger Language Models improve Complex Reasoning [41.03267013352519]
大きな言語モデル(LLM)は、印象的な推論能力を示すチェーン・オブ・シントを生成するように促された。本稿では、分解生成器を用いて複雑な問題をより少ない推論ステップを必要とするサブプロブレムに分解するDaSLaMを紹介する。本稿では,DaSLaMがスケール関数としての解の能力に制限されないことを示す。
論文参考訳（メタデータ） (2023-10-21T15:23:20Z)
Adaptive-Solver Framework for Dynamic Strategy Selection in Large Language Model Reasoning [34.568072559937455]
大きな言語モデル(LLM)は、複雑な推論タスクを扱う際、印象的な能力を示している。 LLMを利用するほとんどの方法論は、一様アプローチを採用する傾向がある。それらの柔軟性は不要な計算オーバーヘッドや準最適性能をもたらす可能性がある。本稿では,問題の難易度に基づく問題解決戦略を戦略的に調整するAdaptive-rフレームワークを提案する。
論文参考訳（メタデータ） (2023-10-01T12:28:36Z)
Faith and Fate: Limits of Transformers on Compositionality [109.79516190693415]
3つの代表的構成課題にまたがる変圧器大言語モデルの限界について検討する。これらのタスクは、問題をサブステップに分割し、これらのステップを正確な答えに合成する必要があります。実験結果から,多段階合成推論を線形化部分グラフマッチングに還元することにより,トランスフォーマーLLMが構成課題を解くことが示唆された。
論文参考訳（メタデータ） (2023-05-29T23:24:14Z)
Distilling Reasoning Capabilities into Smaller Language Models [83.66051257039763]
思考の連鎖(CoT)のようなステップバイステップの推論アプローチは、大規模言語モデルにおける推論能力の誘導に非常に効果的であることが証明されている。しかし、CoTアプローチの成功は基本的にモデルのサイズに結びついており、CoTを機能させるためには数十億のパラメータスケールモデルが必要であることが多い。本研究では,大規模モデルのCoT推論能力を段階的に活用し,これらの能力をより小さなモデルに蒸留する知識蒸留手法を提案する。
論文参考訳（メタデータ） (2022-12-01T00:39:56Z)
Direct Heterogeneous Causal Learning for Resource Allocation Problems in Marketing [20.9377115817821]
マーケティングは、ユーザのエンゲージメントを高め、プラットフォーム収益を改善するための重要なメカニズムである。マーケティングにおける意思決定問題は資源配分問題として定式化され、数十年にわたって研究されてきた。既存の作業は通常、解法を2つの完全に分離された段階、すなわち機械学習(ML)と操作研究(OR)に分割する。
論文参考訳（メタデータ） (2022-11-28T19:27:34Z)
A Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering [60.768146126094955]
弱々しい教師付き質問応答は通常、最終的な答えのみを監督信号として持つ。偶然に正解を導出する刺激的な解が多数存在するかもしれないが、そのような解の訓練はモデルの性能を損なう可能性がある。本稿では,質問応答対と予測解間の相互情報の最大化により,このような意味的相関を明示的に活用することを提案する。
論文参考訳（メタデータ） (2021-06-14T05:47:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。