論文の概要: Test-time Computing: from System-1 Thinking to System-2 Thinking
- arxiv url: http://arxiv.org/abs/2501.02497v1
- Date: Sun, 05 Jan 2025 10:24:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:10:02.668742
- Title: Test-time Computing: from System-1 Thinking to System-2 Thinking
- Title(参考訳): テストタイムコンピューティング:システム1思考からシステム2思考へ
- Authors: Yixin Ji, Juntao Li, Hai Ye, Kaixin Wu, Jia Xu, Linjian Mo, Min Zhang,
- Abstract要約: テストタイムコンピューティングの概念をSystem-1モデルに遡る。
システム1モデルからシステム2モデルへの移行において,テストタイムコンピューティングが果たす重要な役割を強調した。
- 参考スコア(独自算出の注目度): 28.062866031945585
- License:
- Abstract: The remarkable performance of the o1 model in complex reasoning demonstrates that test-time computing scaling can further unlock the model's potential, enabling powerful System-2 thinking. However, there is still a lack of comprehensive surveys for test-time computing scaling. We trace the concept of test-time computing back to System-1 models. In System-1 models, test-time computing addresses distribution shifts and improves robustness and generalization through parameter updating, input modification, representation editing, and output calibration. In System-2 models, it enhances the model's reasoning ability to solve complex problems through repeated sampling, self-correction, and tree search. We organize this survey according to the trend of System-1 to System-2 thinking, highlighting the key role of test-time computing in the transition from System-1 models to weak System-2 models, and then to strong System-2 models. We also point out a few possible future directions.
- Abstract(参考訳): 複雑な推論におけるo1モデルの顕著な性能は、テスト時間コンピューティングのスケーリングがモデルの可能性をさらに開放し、強力なSystem-2思考を可能にすることを証明している。
しかしながら、テスト時間コンピューティングのスケーリングに関する包括的な調査は、まだ不足している。
テストタイムコンピューティングの概念をSystem-1モデルに遡る。
System-1モデルでは、テストタイムコンピューティングは分散シフトに対処し、パラメータ更新、入力修正、表現編集、出力校正によって堅牢性と一般化を改善する。
System-2モデルでは、繰り返しサンプリング、自己補正、木の探索によって、複雑な問題を解決するモデルの推論能力を高める。
システム1モデルからシステム2モデルへの移行においてテストタイムコンピューティングが果たす重要な役割を、システム1モデルからシステム2モデルへ、そして強力なシステム2モデルへと明らかにした。
今後の方向性もいくつか指摘しています。
関連論文リスト
- System-1.x: Learning to Balance Fast and Slow Planning with Language Models [68.77277620915143]
言語モデルは、2つの異なるモードで長期計画問題の解決に使用できる。
高速な 'System-1' モード、明示的な検索やバックトラックなしで直接計画を生成する、遅い 'System-2' モード、ステップバイステップの計画。
LLMを用いた制御可能な計画フレームワークであるSystem-1.x Plannerを提案する。
論文 参考訳(メタデータ) (2024-07-19T15:40:59Z) - DOMINO: A Dual-System for Multi-step Visual Language Reasoning [76.69157235928594]
視覚情報抽出のための「System-1」ステップと、意図的な推論のための「System-2」ステップからなる多段階マルチモーダル推論のためのデュアルシステムを提案する。
事前学習した System-2 モジュールを用いた本手法は, 配当データと配当データの先行処理と比較して, 競合的に動作する。
論文 参考訳(メタデータ) (2023-10-04T13:29:47Z) - Representing Timed Automata and Timing Anomalies of Cyber-Physical
Production Systems in Knowledge Graphs [51.98400002538092]
本稿では,学習されたタイムドオートマトンとシステムに関する公式知識グラフを組み合わせることで,CPPSのモデルベース異常検出を改善することを目的とする。
モデルと検出された異常の両方を知識グラフに記述し、モデルと検出された異常をより容易に解釈できるようにする。
論文 参考訳(メタデータ) (2023-08-25T15:25:57Z) - From system models to class models: An in-context learning paradigm [0.0]
本稿では,1段階の予測と複数段階のシミュレーションという2つの主要な課題に対処する,システム識別のための新しいパラダイムを提案する。
動的システムのクラスを表すメタモデルを学ぶ。
一段階の予測では、GPTのようなデコーダのみのアーキテクチャを使用し、シミュレーション問題ではエンコーダ-デコーダ構造を用いる。
論文 参考訳(メタデータ) (2023-08-25T13:50:17Z) - Clarifying System 1 & 2 through the Common Model of Cognition [0.0]
認識の共通モデルを用いてシステム1とシステム2を接地する。
本研究の目的は,その基盤となるメカニズム,誤解の持続,メタ認知への示唆を明らかにすることである。
論文 参考訳(メタデータ) (2023-05-18T02:25:03Z) - AAAI 2022 Fall Symposium: System-1 and System-2 realized within the
Common Model of Cognition [0.0]
認知の共通モデルにSystem-1とSystem-2を配置する。
その結果, System-1 と 2 の特徴的な特徴と考えられるものは,その代わりに認知特性のスペクトルを形成することが明らかとなった。
論文 参考訳(メタデータ) (2023-05-16T01:28:06Z) - Probabilistic machine learning based predictive and interpretable
digital twin for dynamical systems [0.0]
ディジタルツインを更新するための2つのアプローチが提案されている。
どちらの場合も、更新されたデジタル双生児の表現は同一である。
提案手法は、ディジタル双対モデルにおける摂動の正確な説明を提供する。
論文 参考訳(メタデータ) (2022-12-19T04:25:59Z) - Improving Coherence and Consistency in Neural Sequence Models with
Dual-System, Neuro-Symbolic Reasoning [49.6928533575956]
我々は、神経系1と論理系2の間を仲介するために神経推論を用いる。
強靭なストーリー生成とグラウンドド・インストラクション・フォローリングの結果、このアプローチは神経系世代におけるコヒーレンスと精度を高めることができることを示した。
論文 参考訳(メタデータ) (2021-07-06T17:59:49Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。