論文の概要: A Small Math Model: Recasting Strategy Choice Theory in an LLM-Inspired Architecture
- arxiv url: http://arxiv.org/abs/2509.24068v1
- Date: Sun, 28 Sep 2025 20:58:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.614581
- Title: A Small Math Model: Recasting Strategy Choice Theory in an LLM-Inspired Architecture
- Title(参考訳): 小さな数学モデル: LLMにインスパイアされたアーキテクチャにおけるリキャスト戦略選択理論
- Authors: Roussel Rahman, Jeff Shrager,
- Abstract要約: 「戦略選択理論(SCT)脚注戦略選択理論」
SCTをSmall Math Model' (SMM) として再放送する
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Strategy Choice Theory (SCT)\footnote{``Strategy Choice Theory'', ``Distributions of Associations'', and ``Overlapping Wave Theory'' have been used to refer to this line of work, emphasizing different aspects.}\citep[e.g.,][]{siegler1984strategychoices, siegler2000rebirth} explains important aspects of children's arithmetic learning based upon principles including learning from developmentally naturalistic data, probabilistic representation, confidence-based retrieval, and the phase-like importance of scaffolding strategies, such as finger-counting. Here we recast SCT as a ``Small Math Model'' (SMM), employing a neural-network-based architecture analogous to LLMs. The SMM extends SCT to include counting practice\footnote{The original SCT model was pre-biased in accordance with the supposed experience of counting.}, symbol (number) embedding, and gated attention. Similar to earlier work, the SMM demonstrates constructive and destructive interference between counting and addition, and the ``wave-like'' use of finger-counting as sum recall improves. We plan to extend the SMM to later aspects of the decades-long SCT program, including adaptive strategy choice and eventually strategy discovery, providing a unified platform to investigate the understanding of numerical characteristics and relationships essential for mathematical reasoning -- as it can emerge in LLM-based agents.
- Abstract(参考訳): 戦略選択理論 (SCT)\footnote{``Strategy Choice Theory'', ```Distributions of Associations'', ``Overlapping Wave Theory'') は、異なる側面を強調したこの研究の行を指すために用いられている。
}\citep[e g ,][]{siegler 1984strategychoices, siegler2000rebirth} は、発達的自然主義的データからの学習、確率的表現、信頼に基づく検索、そして指数のような足場戦略のフェーズライクな重要性などに基づいて、子どもの算術学習の重要な側面を説明する。
そこで我々は,SCTを '`Small Math Model' (SMM)' として再放送し,LLMに類似したニューラルネットワークベースのアーキテクチャを用いる。
SMM は SCT を拡張してcounting practice\footnote{ を含ませる。
シンボル(数値)の埋め込み、注意を喚起する。
初期の研究と同様に、SMMは計数と加算の間の建設的かつ破壊的な干渉を示し、合計リコールが向上するにつれて「波状」の指計数の使用が向上する。
我々は、SMMを、適応戦略選択や最終的には戦略発見を含む数十年にわたるSCTプログラムの後期的な側面にまで拡張し、数学的推論に不可欠な数値的特徴と関係を理解するための統一されたプラットフォームを提供する。
関連論文リスト
- Task-Agnostic Learnable Weighted-Knowledge Base Scheme for Robust Semantic Communications [52.36313868773825]
本稿では,手堅い画像伝送のためのタスク非依存学習型重み付き知識ベースセマンティックコミュニケーション(TALSC)フレームワークを提案する。
このフレームワークには、メタラーナーとしてサンプル信頼モジュール(SCM)と学習者としての意味的符号化ネットワークが組み込まれている。
シミュレーションにより,TALSCフレームワークは,タスク非依存の画像意味コミュニケーションにおけるフリップノイズとクラス不均衡の効果を効果的に緩和することを示した。
論文 参考訳(メタデータ) (2025-09-15T07:10:21Z) - In-Context Learning Strategies Emerge Rationally [36.21854069812912]
タスクの混合を学習する訓練を行うと、ICLの実行モデルによって学習された戦略がベイズ予測器のファミリーによって捕捉されることを示す。
我々は、トレーニングを通してTransformerの次なる予測をほぼ完全に予測する階層型ベイズフレームワークを開発した。
我々の研究は、戦略損失と複雑性の間のトレードオフを基礎としたICLの説明的かつ予測的な説明を前進させます。
論文 参考訳(メタデータ) (2025-06-21T23:49:08Z) - A Theory of Inference Compute Scaling: Reasoning through Directed Stochastic Skill Search [15.387256204743407]
大規模言語モデル(LLM)は、訓練と配備の間にかなりの計算量、エネルギー、財務資源を必要とする。
推論コストは、今やリソース全体の負担の重要かつ増大する要素である。
本稿では,学習したスキルグラフ上での推論を表現力として表現する一般的なフレームワークである有向スキルサーチ(DS3)を紹介する。
論文 参考訳(メタデータ) (2025-06-10T14:47:48Z) - Embodied-R: Collaborative Framework for Activating Embodied Spatial Reasoning in Foundation Models via Reinforcement Learning [58.86928947970342]
Embodied-Rは、知覚のための大規模視覚言語モデルと推論のための小規模言語モデルを組み合わせたフレームワークである。
わずか5kのエボダイドビデオサンプルのトレーニングの後、Embodied-Rと3B LMは最先端のマルチモーダル推論モデルと一致した。
Embodied-Rは、体系的分析や文脈統合のような創発的な思考パターンも示している。
論文 参考訳(メタデータ) (2025-04-17T06:16:11Z) - A Top-down Graph-based Tool for Modeling Classical Semantic Maps: A Crosslinguistic Case Study of Supplementary Adverbs [50.982315553104975]
セマンティックマップモデル(SMM)は、言語横断的なインスタンスや形式からネットワークのような概念空間を構築する。
ほとんどのSMMは、ボトムアップ手順を使用して、人間の専門家によって手動で構築される。
本稿では,概念空間とSMMをトップダウンで自動生成するグラフベースの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:06:41Z) - Mastery Guided Non-parametric Clustering to Scale-up Strategy Prediction [1.1049608786515839]
Node2Vecをベースとした表現を学び、熟達度やスキルレベルの対称性を符号化します。
我々は,MATHiaの大規模データセットから数学学習の戦略を学習するために,本モデルを適用した。
論文 参考訳(メタデータ) (2024-01-04T17:57:21Z) - The Geometry of Self-supervised Learning Models and its Impact on
Transfer Learning [62.601681746034956]
自己教師型学習(SSL)はコンピュータビジョンにおいて望ましいパラダイムとして登場した。
本稿では,各特徴空間内の局所的近傍を用いて異なるSSLモデルを分析するためのデータ駆動幾何学的手法を提案する。
論文 参考訳(メタデータ) (2022-09-18T18:15:38Z) - Categorical semantics of compositional reinforcement learning [19.20599654208014]
我々は、強化学習(RL)の構成理論のための知識表現フレームワークを開発する。
我々のアプローチは、タスクのモデルとして働くマルコフ決定過程(MDP)を対象とするカテゴリMDPの理論的研究に依存している。
カテゴリ MDP で表される構成保証に依存するジグザグ図を導入する。
論文 参考訳(メタデータ) (2022-08-29T15:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。