論文の概要: Towards a Theoretical Understanding of the 'Reversal Curse' via Training Dynamics
- arxiv url: http://arxiv.org/abs/2405.04669v1
- Date: Tue, 7 May 2024 21:03:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 18:41:08.890352
- Title: Towards a Theoretical Understanding of the 'Reversal Curse' via Training Dynamics
- Title(参考訳): トレーニングダイナミクスによる「リバーサルカース」の理論的理解に向けて
- Authors: Hanlin Zhu, Baihe Huang, Shaolun Zhang, Michael Jordan, Jiantao Jiao, Yuandong Tian, Stuart Russell,
- Abstract要約: 自動回帰型大言語モデル(LLM)は、多くの複雑な推論タスクを解くのに優れた能力を示す。
LLMは、'A is B'でトレーニングされた場合、推論中に'B is A'を直接結論付けることができません。
- 参考スコア(独自算出の注目度): 45.69328374321502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Auto-regressive large language models (LLMs) show impressive capacities to solve many complex reasoning tasks while struggling with some simple logical reasoning tasks such as inverse search: when trained on ''A is B'', LLM fails to directly conclude ''B is A'' during inference, which is known as the ''reversal curse'' (Berglund et al., 2023). In this paper, we theoretically analyze the reversal curse via the training dynamics of (stochastic) gradient descent for two auto-regressive models: (1) a bilinear model that can be viewed as a simplification of a one-layer transformer; (2) one-layer transformers using the framework of Tian et al. (2023a). Our analysis reveals a core reason why the reversal curse happens: the (effective) weights of both auto-regressive models show asymmetry, i.e., the increase of weights from a token $A$ to token $B$ during training does not necessarily cause the increase of the weights from $B$ to $A$. Moreover, our analysis can be naturally applied to other logical reasoning tasks such as chain-of-thought (COT) (Wei et al., 2022b). We show the necessity of COT, i.e., a model trained on ''$A \to B$'' and ''$B \to C$'' fails to directly conclude ''$A \to C$'' without COT (also empirically observed by Allen-Zhu and Li (2023)), for one-layer transformers via training dynamics, which provides a new perspective different from previous work (Feng et al., 2024) that focuses on expressivity. Finally, we also conduct experiments to validate our theory on multi-layer transformers under different settings.
- Abstract(参考訳): 自己回帰型大規模言語モデル(LLM)は、逆探索のような単純な論理的推論タスクに苦労しながら、多くの複雑な推論タスクを解くのに顕著な能力を示す: 'A is B'' で訓練された場合、LLMは推論中に直接 'B is A' を結論付けることができず、これは'Reversal curse' として知られている(Berglund et al , 2023)。
本稿では, 1層変圧器を単純化した双線形モデル, 2) Tian et al (2023a) の枠組みを用いた一層変圧器を理論的に解析する。
さらに、我々の分析は、チェイン・オブ・シント(COT)のような他の論理的推論タスク(Wei et al , 2022b)にも自然に適用できる。
我々は、COT(Allen-Zhu と Li (2023) によって実証的に観察される)を使わずに、COT が ''A \to B$' と ''B \to C$'' に基づいて訓練されたモデルの必要性を示す。
- On the Role of Depth and Looping for In-Context Learning with Task Diversity [69.4145579827826]
We show that multilayer Transformer is not robust to even distributional shifts as $O(e-L)$ in Wasserstein distance。
論文 参考訳(メタデータ) (2024-10-29T03:27:56Z) - Unveiling Induction Heads: Provable Training Dynamics and Feature Learning in Transformers [54.20763128054692]
クロスエントロピー ICL 損失に対する勾配流が極限モデルに収束することを証明する。
論文 参考訳(メタデータ) (2024-09-09T18:10:26Z) - Towards Better Understanding of In-Context Learning Ability from In-Context Uncertainty Quantification [7.869708570399577]
条件付き期待値 $mathbbE[Y|X]$ と条件付き分散 Var$(Y|X)$ の両方を予測する双目的予測タスクを考える。
論文 参考訳(メタデータ) (2024-05-24T00:08:55Z) - How do Transformers perform In-Context Autoregressive Learning? [76.18489638049545]
トレーニングされたTransformerが、まず$W$ in-contextを学習し、次に予測マッピングを適用することで、次のトークンを予測する方法を示す。
論文 参考訳(メタデータ) (2024-02-08T16:24:44Z) - Local Convergence of Approximate Newton Method for Two Layer Nonlinear
Regression [21.849997443967705]
論文 参考訳(メタデータ) (2023-11-26T19:19:02Z) - A Unified Scheme of ResNet and Softmax [8.556540804058203]
回帰問題を理論的に解析する: $| langle exp(Ax) + A x, bf 1_n rangle-1 ( exp(Ax) + Ax )
論文 参考訳(メタデータ) (2023-09-23T21:41:01Z) - Characterizing Datapoints via Second-Split Forgetting [93.99363547536392]
我々は、オリジナルのトレーニング例が忘れられた後(もしあれば)のエポックを追跡する補足的メトリックである$$-second-$split$$forgetting$$$time$ (SSFT)を提案する。
論文 参考訳(メタデータ) (2022-10-26T21:03:46Z) - Gradient-based Counterfactual Explanations using Tractable Probabilistic
Models [20.770168600755877]
論文 参考訳(メタデータ) (2022-05-16T16:05:43Z) - Understanding the Difficulty of Training Transformers [120.99980924577787]
論文 参考訳(メタデータ) (2020-04-17T13:59:07Z)