論文の概要: Interleaving Fast and Slow Decision Making
- arxiv url: http://arxiv.org/abs/2010.16244v2
- Date: Fri, 26 Mar 2021 16:49:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 16:54:24.199554
- Title: Interleaving Fast and Slow Decision Making
- Title(参考訳): 高速・低速意思決定のインターリービング
- Authors: Aditya Gulati, Sarthak Soni, Shrisha Rao
- Abstract要約: Kahneman氏は、あるタスクに対して高速で直感的なシステム1と、遅くてより分析的なシステム2という、2つの異なる思考スタイルを使うことを提案している。
システム1とシステム2を監督する新しいシステム0を含む,新規で汎用的なフレームワークを提案する。
従来のパックマンゲームの改良版において,システム1のRLアルゴリズム,システム2のモンテカルロ木探索,システム0のいくつかの異なる戦略を用いて,そのようなフレームワークの評価を行った。
- 参考スコア(独自算出の注目度): 7.41244589428771
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The "Thinking, Fast and Slow" paradigm of Kahneman proposes that we use two
different styles of thinking -- a fast and intuitive System 1 for certain
tasks, along with a slower but more analytical System 2 for others. While the
idea of using this two-system style of thinking is gaining popularity in AI and
robotics, our work considers how to interleave the two styles of
decision-making, i.e., how System 1 and System 2 should be used together. For
this, we propose a novel and general framework which includes a new System 0 to
oversee Systems 1 and 2. At every point when a decision needs to be made,
System 0 evaluates the situation and quickly hands over the decision-making
process to either System 1 or System 2. We evaluate such a framework on a
modified version of the classic Pac-Man game, with an already-trained RL
algorithm for System 1, a Monte-Carlo tree search for System 2, and several
different possible strategies for System 0. As expected, arbitrary switches
between Systems 1 and 2 do not work, but certain strategies do well. With
System 0, an agent is able to perform better than one that uses only System 1
or System 2.
- Abstract(参考訳): Kahneman氏の"Thinking, Fast and Slow"パラダイムは、あるタスクに対して高速で直感的なシステム1と、遅いがより分析的なシステム2という、2つの異なる思考スタイルを使うことを提案している。
この2システム方式の思考はAIやロボティクスで人気が高まりつつあるが、我々の研究は、意思決定の2つのスタイルをどのようにインターリーブするか、すなわち、システム1とシステム2をどのように組み合わせるべきかを考える。
そこで本研究では,システム1とシステム2を監督する新しいシステム0を含む,新規で汎用的なフレームワークを提案する。
意思決定が必要なすべての時点で、システム0は状況を評価し、意思決定プロセスをシステム1またはシステム2に迅速に引き渡す。
従来のパックマンゲームの改良版において,システム1のRLアルゴリズム,システム2のモンテカルロ木探索,システム0のいくつかの異なる戦略を用いて,そのようなフレームワークの評価を行った。
予想通り、システム1と2の任意の切り替えは機能しないが、特定の戦略がうまく機能する。
System 0では、エージェントはSystem 1またはSystem 2のみを使用するエージェントよりもパフォーマンスがよい。
関連論文リスト
- Based on What We Can Control Artificial Neural Networks [1.0606089830347052]
制御システムからの知識を利用することで,システム機能を解析し,システム応答をシミュレートすることができる。
ANNの制御は,(1)全てのオプティマイザがコントローラとして機能し,(2)全ての学習システムが入力と出力で制御システムとして機能し,(3)オプティマイザが学習システムに適合するように,オプティマイザと学習システムの設計の恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-10-09T13:09:38Z) - AAAI 2022 Fall Symposium: System-1 and System-2 realized within the
Common Model of Cognition [0.0]
認知の共通モデルにSystem-1とSystem-2を配置する。
その結果, System-1 と 2 の特徴的な特徴と考えられるものは,その代わりに認知特性のスペクトルを形成することが明らかとなった。
論文 参考訳(メタデータ) (2023-05-16T01:28:06Z) - Fast and Slow Planning [25.91512962807549]
SOFAIは、高速または遅いと特徴付ける異なる機能と、それらを制御するメタ認知モジュールを備えた、複数の解決アプローチを利用する。
このシステムの振舞いは最先端の解法と比較され、新たに導入されたシステムは一般性の観点からより良い結果を示すことを示す。
論文 参考訳(メタデータ) (2023-03-07T23:05:38Z) - Learning Connectivity-Maximizing Network Configurations [123.01665966032014]
本稿では、専門家からコミュニケーションエージェントを配置することを学ぶ畳み込みニューラルネットワーク(CNN)を用いた教師あり学習手法を提案する。
我々は,標準ライントポロジやリングトポロジ,ランダムに生成された105万件のテストケース,トレーニング中に見えない大規模なチームについて,CNNのパフォーマンスを実証した。
トレーニング後,本システムは10~20名のエージェントの最適化手法よりも2桁高速な接続構成を生成する。
論文 参考訳(メタデータ) (2021-12-14T18:59:01Z) - Learning Physical Concepts in Cyber-Physical Systems: A Case Study [72.74318982275052]
本稿では,時系列データにおける物理概念の学習方法に関する研究の現状について概説する。
また,3タンクシステムの例を用いて,最先端技術から最も重要な手法を分析した。
論文 参考訳(メタデータ) (2021-11-28T14:24:52Z) - Improving Coherence and Consistency in Neural Sequence Models with
Dual-System, Neuro-Symbolic Reasoning [49.6928533575956]
我々は、神経系1と論理系2の間を仲介するために神経推論を用いる。
強靭なストーリー生成とグラウンドド・インストラクション・フォローリングの結果、このアプローチは神経系世代におけるコヒーレンスと精度を高めることができることを示した。
論文 参考訳(メタデータ) (2021-07-06T17:59:49Z) - Joint System-Wise Optimization for Pipeline Goal-Oriented Dialog System [76.22810715401147]
本稿では,パイプラインダイアログシステムのための新しい統合システムワイド最適化手法を提案する。
まず,NLUトレーニングのためのラベル付けプロセスを自動化する新しいデータ拡張手法を提案する。
第2に,ポアソン分布を用いた新しいポリシパラメータ化を提案する。
論文 参考訳(メタデータ) (2021-06-09T06:44:57Z) - Reconfiguring Hybrid Systems Using SAT [5.208405959764275]
リコンフィグレーションは、システム構成を自動的に適応することで、障害からシステムを取り戻すことを目的としている。
本研究は,3つの課題を解く新しいアルゴリズムを提案する。
この手法はプロセス工学シミュレーションシステム上で障害を再構成できることが示されている。
論文 参考訳(メタデータ) (2021-05-18T09:50:47Z) - Bandit Linear Optimization for Sequential Decision Making and
Extensive-Form Games [102.23975166536326]
tree-form sequential decision making (tfsdm) は、エージェントと潜在的に敵対的な環境の間のツリー形式の相互作用をモデル化することで、古典的なワンショット意思決定を拡張する。
これは、各プレイヤーが幅広い形式のゲームで直面するオンライン意思決定問題、およびマルコフ決定プロセス、およびエージェントが観測された履歴を条件とする部分観察可能なマルコフ決定プロセスをキャプチャする。
本稿では, (i) 線形時間損失と (ii) $o(sqrtt)$ cumulative regret の両方を提供する拡張dmのバンディット線形最適化問題に対する最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T05:00:13Z) - Towards an Interface Description Template for AI-enabled Systems [77.34726150561087]
再利用(Reuse)は、システムアーキテクチャを既存のコンポーネントでインスタンス化しようとする、一般的なシステムアーキテクチャのアプローチである。
現在、コンポーネントが当初目的としていたものと異なるシステムで運用する可搬性を評価するために必要な情報の選択をガイドするフレームワークは存在しない。
我々は、AI対応コンポーネントの主情報をキャプチャするインターフェイス記述テンプレートの確立に向けて、現在進行中の作業について述べる。
論文 参考訳(メタデータ) (2020-07-13T20:30:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。