論文の概要: Interleaving Fast and Slow Decision Making
- arxiv url: http://arxiv.org/abs/2010.16244v2
- Date: Fri, 26 Mar 2021 16:49:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 16:54:24.199554
- Title: Interleaving Fast and Slow Decision Making
- Title(参考訳): 高速・低速意思決定のインターリービング
- Authors: Aditya Gulati, Sarthak Soni, Shrisha Rao
- Abstract要約: Kahneman氏は、あるタスクに対して高速で直感的なシステム1と、遅くてより分析的なシステム2という、2つの異なる思考スタイルを使うことを提案している。
システム1とシステム2を監督する新しいシステム0を含む,新規で汎用的なフレームワークを提案する。
従来のパックマンゲームの改良版において,システム1のRLアルゴリズム,システム2のモンテカルロ木探索,システム0のいくつかの異なる戦略を用いて,そのようなフレームワークの評価を行った。
- 参考スコア(独自算出の注目度): 7.41244589428771
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The "Thinking, Fast and Slow" paradigm of Kahneman proposes that we use two
different styles of thinking -- a fast and intuitive System 1 for certain
tasks, along with a slower but more analytical System 2 for others. While the
idea of using this two-system style of thinking is gaining popularity in AI and
robotics, our work considers how to interleave the two styles of
decision-making, i.e., how System 1 and System 2 should be used together. For
this, we propose a novel and general framework which includes a new System 0 to
oversee Systems 1 and 2. At every point when a decision needs to be made,
System 0 evaluates the situation and quickly hands over the decision-making
process to either System 1 or System 2. We evaluate such a framework on a
modified version of the classic Pac-Man game, with an already-trained RL
algorithm for System 1, a Monte-Carlo tree search for System 2, and several
different possible strategies for System 0. As expected, arbitrary switches
between Systems 1 and 2 do not work, but certain strategies do well. With
System 0, an agent is able to perform better than one that uses only System 1
or System 2.
- Abstract(参考訳): Kahneman氏の"Thinking, Fast and Slow"パラダイムは、あるタスクに対して高速で直感的なシステム1と、遅いがより分析的なシステム2という、2つの異なる思考スタイルを使うことを提案している。
この2システム方式の思考はAIやロボティクスで人気が高まりつつあるが、我々の研究は、意思決定の2つのスタイルをどのようにインターリーブするか、すなわち、システム1とシステム2をどのように組み合わせるべきかを考える。
そこで本研究では,システム1とシステム2を監督する新しいシステム0を含む,新規で汎用的なフレームワークを提案する。
意思決定が必要なすべての時点で、システム0は状況を評価し、意思決定プロセスをシステム1またはシステム2に迅速に引き渡す。
従来のパックマンゲームの改良版において,システム1のRLアルゴリズム,システム2のモンテカルロ木探索,システム0のいくつかの異なる戦略を用いて,そのようなフレームワークの評価を行った。
予想通り、システム1と2の任意の切り替えは機能しないが、特定の戦略がうまく機能する。
System 0では、エージェントはSystem 1またはSystem 2のみを使用するエージェントよりもパフォーマンスがよい。
関連論文リスト
- System-1.x: Learning to Balance Fast and Slow Planning with Language Models [68.77277620915143]
言語モデルは、2つの異なるモードで長期計画問題の解決に使用できる。
高速な 'System-1' モード、明示的な検索やバックトラックなしで直接計画を生成する、遅い 'System-2' モード、ステップバイステップの計画。
LLMを用いた制御可能な計画フレームワークであるSystem-1.x Plannerを提案する。
論文 参考訳(メタデータ) (2024-07-19T15:40:59Z) - Distilling System 2 into System 1 [35.194258450176534]
大規模言語モデル(LLM)は、中間思考を生成するために推論中に余分な計算に費やすことができる。
そこで本研究では, 従来のシステム1の性能と比較して, 改良された結果が得られることを示す。
論文 参考訳(メタデータ) (2024-07-08T15:17:46Z) - Fast and Slow Generating: An Empirical Study on Large and Small Language Models Collaborative Decoding [27.004817441034795]
大規模言語モデルと小言語モデル(SLM)の協調的復号化は,これらの問題を緩和するための有望な戦略を示す。
両プロセス認知理論に着想を得て,FS-GEN(Fast and Slow Generating)と呼ばれる統合フレームワークを提案する。
このフレームワーク内では、LSMはSystem 2(slow and intention)に、独立したSLMはSystem 1に分類される。
論文 参考訳(メタデータ) (2024-06-18T05:59:28Z) - System-2 Recommenders: Disentangling Utility and Engagement in Recommendation Systems via Temporal Point-Processes [80.97898201876592]
本稿では,過去のコンテンツインタラクションが,自己興奮型ホークスプロセスに基づくユーザの到着率に影響を及ぼす生成モデルを提案する。
そこで本研究では,システム1とシステム2のアンタングルを解消し,ユーザ利用によるコンテンツ最適化を可能にすることを解析的に示す。
論文 参考訳(メタデータ) (2024-05-29T18:19:37Z) - AAAI 2022 Fall Symposium: System-1 and System-2 realized within the
Common Model of Cognition [0.0]
認知の共通モデルにSystem-1とSystem-2を配置する。
その結果, System-1 と 2 の特徴的な特徴と考えられるものは,その代わりに認知特性のスペクトルを形成することが明らかとなった。
論文 参考訳(メタデータ) (2023-05-16T01:28:06Z) - Fast and Slow Planning [25.91512962807549]
SOFAIは、高速または遅いと特徴付ける異なる機能と、それらを制御するメタ認知モジュールを備えた、複数の解決アプローチを利用する。
このシステムの振舞いは最先端の解法と比較され、新たに導入されたシステムは一般性の観点からより良い結果を示すことを示す。
論文 参考訳(メタデータ) (2023-03-07T23:05:38Z) - Learning Connectivity-Maximizing Network Configurations [123.01665966032014]
本稿では、専門家からコミュニケーションエージェントを配置することを学ぶ畳み込みニューラルネットワーク(CNN)を用いた教師あり学習手法を提案する。
我々は,標準ライントポロジやリングトポロジ,ランダムに生成された105万件のテストケース,トレーニング中に見えない大規模なチームについて,CNNのパフォーマンスを実証した。
トレーニング後,本システムは10~20名のエージェントの最適化手法よりも2桁高速な接続構成を生成する。
論文 参考訳(メタデータ) (2021-12-14T18:59:01Z) - Learning Physical Concepts in Cyber-Physical Systems: A Case Study [72.74318982275052]
本稿では,時系列データにおける物理概念の学習方法に関する研究の現状について概説する。
また,3タンクシステムの例を用いて,最先端技術から最も重要な手法を分析した。
論文 参考訳(メタデータ) (2021-11-28T14:24:52Z) - Improving Coherence and Consistency in Neural Sequence Models with
Dual-System, Neuro-Symbolic Reasoning [49.6928533575956]
我々は、神経系1と論理系2の間を仲介するために神経推論を用いる。
強靭なストーリー生成とグラウンドド・インストラクション・フォローリングの結果、このアプローチは神経系世代におけるコヒーレンスと精度を高めることができることを示した。
論文 参考訳(メタデータ) (2021-07-06T17:59:49Z) - Joint System-Wise Optimization for Pipeline Goal-Oriented Dialog System [76.22810715401147]
本稿では,パイプラインダイアログシステムのための新しい統合システムワイド最適化手法を提案する。
まず,NLUトレーニングのためのラベル付けプロセスを自動化する新しいデータ拡張手法を提案する。
第2に,ポアソン分布を用いた新しいポリシパラメータ化を提案する。
論文 参考訳(メタデータ) (2021-06-09T06:44:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。