Fugu-MT 論文翻訳(概要): Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

論文の概要: Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

arxiv url: http://arxiv.org/abs/2505.14530v1
Date: Tue, 20 May 2025 15:49:15 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-21 14:49:53.544055
Title: Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs
Title（参考訳）: 内部整合性:LLMにおける層次サブタスクスケジューリングの実証的証拠
Authors: Zhipeng Yang, Junzhuo Li, Siyu Xia, Xuming Hu,
Abstract要約: 大規模言語モデル (LLM) は連続的に分解され、複合タスクを層ごとに実行する。 i)異なるサブタスクは異なるネットワーク深さで学習され、ii)これらのサブタスクは層間で順次実行される。
参考スコア（独自算出の注目度）: 20.139581575671436
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We show that large language models (LLMs) exhibit an $\textit{internal chain-of-thought}$: they sequentially decompose and execute composite tasks layer-by-layer. Two claims ground our study: (i) distinct subtasks are learned at different network depths, and (ii) these subtasks are executed sequentially across layers. On a benchmark of 15 two-step composite tasks, we employ layer-from context-masking and propose a novel cross-task patching method, confirming (i). To examine claim (ii), we apply LogitLens to decode hidden states, revealing a consistent layerwise execution pattern. We further replicate our analysis on the real-world $\text{TRACE}$ benchmark, observing the same stepwise dynamics. Together, our results enhance LLMs transparency by showing their capacity to internally plan and execute subtasks (or instructions), opening avenues for fine-grained, instruction-level activation steering.
Abstract（参考訳）: 大規模言語モデル (LLMs) は$\textit{internal chain-of- Thought}$ を示す。 2つの主張が我々の研究を根拠にしている。 (i)異なるネットワーク深さで異なるサブタスクが学習され、 (ii)これらのサブタスクは層間で順次実行される。 15段階の2段階複合タスクのベンチマークでは、レイヤスルーコンテキストマスキングを採用し、新しいクロスタスクパッチ手法を提案し、確認する。 (i)。クレームの検証 (ii) 隠れた状態をデコードするためにLogitLensを適用し、一貫した層単位での実行パターンを明らかにします。実世界の$\text{TRACE}$ベンチマークで解析結果を再現し、同じステップワイズダイナミクスを観察する。本研究の結果は,内部計画とサブタスク(あるいは命令)の実行能力を示すことでLCMの透明性を高め,粒度の細かい,命令レベルのアクティベーションステアリングを行うための道を開いた。

関連論文リスト

Advancing Compositional LLM Reasoning with Structured Task Relations in Interactive Multimodal Communications [42.945657927971]
本稿では,無線ネットワーク上での単一合成LLMを用いて,多様なIMAを実現する新しいパラダイムを提案する。最初の課題に取り組むために、我々はILMを案内する新しい方法であるContextLoRAを提案し、IMA間のリッチな構造化コンテキストを学習する。 3つのベンチマークの実験は、提案されたContextLoRAとContextGearの優位性を示している。
論文参考訳（メタデータ） (2025-07-28T09:33:12Z)
PARALLELPROMPT: Extracting Parallelism from Large Language Model Queries [16.40921376558516]
本稿では,自然ユーザプロンプトにおけるクエリ内並列性を測定する最初のベンチマークであるPARALLELPROMPTを紹介する。我々のデータセットは、パブリックなLLMチャットログから37,000以上の実世界のプロンプトで構成されています。並列戦略とシリアル戦略をベンチマークし、レイテンシ、構造的忠実度、セマンティック忠実度を計測する実行スイートを提供する。
論文参考訳（メタデータ） (2025-06-23T15:05:54Z)
TACO: Enhancing Multimodal In-context Learning via Task Mapping-Guided Sequence Configuration [11.724886737930671]
大規模視覚言語モデル(LVLM)の能力を利用するための重要なメカニズムとして,マルチモーダル・インコンテキスト・ラーニング(ICL)が登場した。本稿では,タスク認識機能を備えた軽量トランスフォーマーモデルTACOについて述べる。 5つのLVLMと9つのデータセットの実験は、TACOが多様なICLタスクのベースラインを一貫して超えることを示した。
論文参考訳（メタデータ） (2025-05-21T05:22:21Z)
Continual LLaVA: Continual Instruction Tuning in Large Vision-Language Models [93.5327725085853]
連続LLaVA(Continuous LLaVA)は、LVLMにおける連続的な命令チューニングに適したリハーサルフリーな手法である。実験により,提案した連続LLaVAは,連続的な命令チューニング過程における忘れを著しく減らし,従来の手法よりも優れていたことが示唆された。
論文参考訳（メタデータ） (2024-11-04T19:55:32Z)
Fine-tuning Large Language Models with Sequential Instructions [2.546845645875049]
既存の命令調整モデルでは、複数の命令でクエリに応答するのに苦労していることがわかった。我々は、微調整データの一部がシーケンシャルに関連したタスクの連鎖を含むべきであると論じる。既存のデータセットの命令を多種多様な複雑なシーケンシャルな命令に変換することで、このプロセスを自動化する。逐次指導チューニングを行ったモデルでは、符号化、数学、オープンエンド生成の結果が改善された。
論文参考訳（メタデータ） (2024-03-12T16:33:30Z)
SMAUG: A Sliding Multidimensional Task Window-Based MARL Framework for Adaptive Real-Time Subtask Recognition [11.236363226878975]
サブタスクベースのマルチエージェント強化学習(MARL)手法により、エージェントは異なるサブタスクに対処する方法を学ぶことができる。 textbfSliding textbfMultidimensional ttextbfAsk window based mtextbfUti-agent reinforcement learnintextbfG framework (SMAUG) を提案する。 StarCraft IIの実験では、SMAUGはすべてのベースラインと比較してパフォーマンス上の優位性を示すだけでなく、より顕著で迅速な報酬の上昇を示す。
論文参考訳（メタデータ） (2024-03-04T08:04:41Z)
ADaPT: As-Needed Decomposition and Planning with Language Models [131.063805299796]
As-Needed Decomposition and Planning for Complex Tasks (ADaPT)について紹介する。 ADaPTは、Large Language Modelsがそれらを実行できない場合、複雑なサブタスクを明示的に計画し、分解する。以上の結果から,ADaPTは強いベースラインを確立した。
論文参考訳（メタデータ） (2023-11-08T17:59:15Z)
Robust Subtask Learning for Compositional Generalization [20.54144051436337]
我々は、どんなタスクでも実行できるように、サブタスクポリシーをトレーニングする問題に焦点を合わせます。我々は、平均的なケースのパフォーマンスとは対照的に、すべてのタスクで最悪のケースのパフォーマンスを最大化することを目指している。
論文参考訳（メタデータ） (2023-02-06T18:19:25Z)
Decomposed Prompting: A Modular Approach for Solving Complex Tasks [55.42850359286304]
本稿では,より単純なサブタスクに分解することで,複雑なタスクを解くための分解プロンプトを提案する。このモジュール構造は、各プロンプトを特定のサブタスクに最適化することを可能にする。 Decomposed Promptingの柔軟性とモジュラリティは、数発のプロンプトで先行作業より優れていることを示す。
論文参考訳（メタデータ） (2022-10-05T17:28:20Z)
Fast Inference and Transfer of Compositional Task Structures for Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文参考訳（メタデータ） (2022-05-25T10:44:25Z)
LDSA: Learning Dynamic Subtask Assignment in Cooperative Multi-Agent Reinforcement Learning [122.47938710284784]
協調型MARLにおける動的サブタスク代入(LDSA)を学習するための新しいフレームワークを提案する。エージェントを異なるサブタスクに合理的に割り当てるために,能力に基づくサブタスク選択戦略を提案する。 LDSAは、より優れたコラボレーションのために、合理的で効果的なサブタスクの割り当てを学習していることを示す。
論文参考訳（メタデータ） (2022-05-05T10:46:16Z)
Learning Task Decomposition with Ordered Memory Policy Network [73.3813423684999]
OMPN(Ordered Memory Policy Network)を提案し、デモから学習することでサブタスク階層を発見する。 ompnは部分的に観測可能な環境に適用でき、高いタスク分解性能を達成できる。私たちの視覚化は、サブタスク階層がモデルに出現できることを確認します。
論文参考訳（メタデータ） (2021-03-19T18:13:35Z)
Meta Reinforcement Learning with Autonomous Inference of Subtask Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文参考訳（メタデータ） (2020-01-01T17:34:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。