論文の概要: Learning to Think from Multiple Thinkers
- arxiv url: http://arxiv.org/abs/2604.24737v1
- Date: Mon, 27 Apr 2026 17:43:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.277321
- Title: Learning to Think from Multiple Thinkers
- Title(参考訳): 複数の思考者から考えることを学ぶ
- Authors: Nirmit Joshi, Roey Magen, Nathan Srebro, Nikolaos Tsilivis, Gal Vardi,
- Abstract要約: 複数の思想家からCoT(Chain-of-Thought)による学習について学ぶ。
一つの思考者からCoTを指導して、計算的に容易に学習できるクラスを考える。
思考者ごとに少量のCoTデータを用いて学習する汎用的な計算効率の高い能動学習アルゴリズムを提供する。
- 参考スコア(独自算出の注目度): 36.86281207757357
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We study learning with Chain-of-Thought (CoT) supervision from multiple thinkers, all of whom provide correct but possibly systematically different solutions, e.g., step-by-step solutions to math problems written by different thinkers, or step-by-step execution traces of different programs solving the same problem. We consider classes that are computationally easy to learn using CoT supervision from a single thinker, but hard to learn with only end-result supervision, i.e., without CoT (Joshi et al. 2025). We establish that, under cryptographic assumptions, learning can be hard from CoT supervision provided by two or a few different thinkers, in passive data-collection settings. On the other hand, we provide a generic computationally efficient active learning algorithm that learns with a small amount of CoT data per thinker that is completely independent of the target accuracy $\varepsilon$, a moderate number of thinkers that scales as $\log \frac{1}{\varepsilon}\log \log \frac{1}{\varepsilon}$, and sufficient passive end-result data that scales as $\frac{1}{\varepsilon}\cdot poly\log\frac{1}{\varepsilon}$.
- Abstract(参考訳): 我々は,複数の思考者から学習を指導し,正しいが体系的に異なる解を提供している。例えば,異なる思考者によって書かれた数学問題に対するステップバイステップの解や,同じ問題を解くプログラムのステップバイステップの実行トレースなどである。
一つの思考者からCoTを指導するが、CoT(Joshi et al 2025)を使わずに、終末的な監督だけでは学習し難いクラスを考える。
暗号的な仮定の下では、受動的データ収集設定において、2つか数名の異なる思想家によって提供されるCoTの監督から学習が困難であることを示す。
一方、ターゲット精度に完全に依存しない少量のCoTデータを用いて学習する汎用的な計算効率のアクティブラーニングアルゴリズムである$\varepsilon$, $\log \frac{1}{\varepsilon}\log \log \frac{1}{\varepsilon}$, $\frac{1}{\varepsilon}\cdot poly\log\frac{1}{\varepsilon}$, $\log \frac{1}{\varepsilon}\log \log \log \frac{1}{\varepsilon}$, $\frac{1}{\varepsilon}\cdot poly\log\frac{1}{\varepsilon}$である。
関連論文リスト
- Sample Complexity of Autoregressive Reasoning: Chain-of-Thought vs. End-to-End [48.8146191570092]
現代の大きな言語モデルはテキストを自動回帰的に生成し、トークンを一度に1つ生成する。
このようなシステムの学習性を研究するため、Joshiらは次世代発電機のためのPAC学習フレームワークを導入した。
2つの質問に対して、サンプルの複雑性が$Tでどのようにスケールするかの分類を明らかにすることで、ほぼ完全な答えを与える。
論文 参考訳(メタデータ) (2026-04-13T20:00:13Z) - CoT Information: Improved Sample Complexity under Chain-of-Thought Supervision [10.29575414214269]
チェーン・オブ・思想(CoT)の監督は、最終的なアウトプットとともに中間的推論ステップを提供する。
本稿では,CoT監督下での学習の統計的理論について述べる。
論文 参考訳(メタデータ) (2025-05-21T18:28:54Z) - Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [72.69498649272347]
条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しいパラダイムを提案する。
提案手法は任意の誤差で理論上真の条件分布を復元可能であることを示す。
論文 参考訳(メタデータ) (2024-10-03T16:12:59Z) - Agnostic Multi-Group Active Learning [24.97598179536084]
能動的学習の観点から,この問題の変種を考察し,学習者がコレクションの各分布からどの例をラベル付けするかを判断する権限を付与する。
我々の主な課題は、不一致に基づくアクティブラーニングのような標準的なアクティブラーニング技術が、マルチグループラーニングの目的に直接適用されないことである。
既存のアルゴリズムを改良し、多群学習の非依存的な定式化のための一貫した能動的学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-06-02T21:24:13Z) - Reduction Algorithms for Persistence Diagrams of Networks: CoralTDA and
PrunIT [27.411830935369498]
計算コストが高いことが、トポロジカルデータ分析の成功を妨げる主要な障害となっている。
我々は,大規模グラフの完全永続化図を計算するために,2つの新しい,驚くほど単純で効果的なアルゴリズムを開発した。
大規模ネットワークにおける実験により,新しい手法で最大95%の計算ゲインが得られることが示された。
論文 参考訳(メタデータ) (2022-11-24T16:52:48Z) - Reducing Adversarially Robust Learning to Non-Robust PAC Learning [39.51923275855131]
非ロマンスな学習者を用いて、仮説クラスを頑健に学習できる還元を与える。
$mathcalA$への呼び出しの数は、例ごとに許容される逆の摂動の数に対数的に依存する。
論文 参考訳(メタデータ) (2020-10-22T20:28:35Z) - Average-case Complexity of Teaching Convex Polytopes via Halfspace
Queries [55.28642461328172]
平均的なケースの教えの複雑さは$Theta(d)$であり、最悪のケースの教えの複雑さは$Theta(n)$とは対照的である。
我々の洞察は、$phi$-separable dichotomiesの平均ケースの複雑さに厳密な拘束力を確立することを可能にする。
論文 参考訳(メタデータ) (2020-06-25T19:59:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。