論文の概要: Have I done enough planning or should I plan more?
- arxiv url: http://arxiv.org/abs/2201.00764v1
- Date: Mon, 3 Jan 2022 17:11:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 13:52:22.869355
- Title: Have I done enough planning or should I plan more?
- Title(参考訳): 十分な計画を立てたのか、もっと計画すべきなのか?
- Authors: Ruiqi He, Yash Raj Jain, Falk Lieder
- Abstract要約: この能力は,学習機構を逆エンジニアリングすることで得られることを示す。
計画のコストと利益に対して、どれだけの計画を実行したか、すぐに適応できることに気付きました。
その結果,計画の量を調整するメタ認知能力は,政策段階のメカニズムによって学習される可能性が示唆された。
- 参考スコア(独自算出の注目度): 0.7734726150561086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: People's decisions about how to allocate their limited computational
resources are essential to human intelligence. An important component of this
metacognitive ability is deciding whether to continue thinking about what to do
and move on to the next decision. Here, we show that people acquire this
ability through learning and reverse-engineer the underlying learning
mechanisms. Using a process-tracing paradigm that externalises human planning,
we find that people quickly adapt how much planning they perform to the cost
and benefit of planning. To discover the underlying metacognitive learning
mechanisms we augmented a set of reinforcement learning models with
metacognitive features and performed Bayesian model selection. Our results
suggest that the metacognitive ability to adjust the amount of planning might
be learned through a policy-gradient mechanism that is guided by metacognitive
pseudo-rewards that communicate the value of planning.
- Abstract(参考訳): 限られた計算資源を割り当てる方法についての人々の決定は、人間の知性にとって不可欠である。
このメタ認知能力の重要な構成要素は、何をすべきか考え続け、次の決定に進むかを決めることである。
そこで本研究では,学習機構を逆エンジニアリングすることで,その能力を得ることを示す。
ヒューマンプランニングを外部化するプロセストレースパラダイムを使用することで、計画のコストと利益に対してどれだけの計画を実行するか、すぐに適応できることが分かりました。
メタ認知学習メカニズムを明らかにするために,メタ認知的特徴を持つ強化学習モデルの集合を拡張し,ベイズモデル選択を行った。
本研究は,計画の価値を伝達するメタ認知的擬似回帰によって導かれる政策段階のメカニズムによって,計画量を調整するメタ認知能力が学習されることを示唆する。
関連論文リスト
- SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - Towards Generalizable Zero-Shot Manipulation via Translating Human
Interaction Plans [58.27029676638521]
我々は、人間の受動的ビデオが、そのようなジェネラリストロボットを学習するための豊富なデータ源であることを示す。
我々は、シーンの現在の画像とゴール画像から将来の手やオブジェクトの設定を予測する人間の計画予測器を学習する。
学習システムは、40個のオブジェクトに一般化する16以上の操作スキルを実現できることを示す。
論文 参考訳(メタデータ) (2023-12-01T18:54:12Z) - What are the mechanisms underlying metacognitive learning? [5.787117733071415]
我々は、この能力は試行錯誤(メタ認知強化学習)から学ぶと仮定する。
ここでは、基礎となる学習メカニズムのモデルを体系化し、より洗練された追加メカニズムで強化する。
以上の結果から,認知戦略の空間における勾配上昇は,観察された定性的現象のほとんどを説明することができることが示唆された。
論文 参考訳(メタデータ) (2023-02-09T18:49:10Z) - An intelligent tutor for planning in large partially observable environments [0.8739101659113157]
本研究では,部分的に観測可能な環境下での計画のための知的チューターを開発し,評価する。
計画戦略を教えるための知的家庭教師と比べ、この新しい知的家庭教師は2つの革新を組み合わせている。
330人の参加者による事前登録実験では、新しいインテリジェントチューターは、部分的に観察可能な環境で良い判断を下す能力を向上させるのに非常に効果的であることが示された。
論文 参考訳(メタデータ) (2023-02-06T13:57:08Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - Anti-Retroactive Interference for Lifelong Learning [65.50683752919089]
我々は脳のメタラーニングと連想機構に基づく生涯学習のパラダイムを設計する。
知識の抽出と知識の記憶という2つの側面から問題に取り組む。
提案した学習パラダイムが,異なるタスクのモデルを同じ最適に収束させることができることを理論的に分析した。
論文 参考訳(メタデータ) (2022-08-27T09:27:36Z) - Procedure Planning in Instructional Videosvia Contextual Modeling and
Model-based Policy Learning [114.1830997893756]
本研究は,実生活ビデオにおける目標指向アクションを計画するモデルを学習することに焦点を当てる。
本研究では,ベイズ推論とモデルに基づく模倣学習を通して,人間の行動のモデル化を行う新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-05T01:06:53Z) - Automatic discovery and description of human planning strategies [0.7734726150561086]
我々は、AIを戦略発見に活用し、人間の計画を理解する。
我々のアルゴリズムはHuman-Interpretと呼ばれ、模倣学習を用いてプロセストレースデータを記述する。
得られた人的計画戦略の記述は,人為的記述とほぼ同程度に理解できることがわかった。
論文 参考訳(メタデータ) (2021-09-29T15:20:16Z) - Improving Human Decision-Making by Discovering Efficient Strategies for
Hierarchical Planning [0.6882042556551609]
計算資源が限られているため、効率的な計画戦略が必要です。
これらの戦略を計算する能力は、以前は非常に小さく、非常に単純な計画タスクに限られていました。
本稿では,この制限を克服できる認知型強化学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-31T19:46:00Z) - The Efficiency of Human Cognition Reflects Planned Information
Processing [40.51474966524166]
タスク全体の構造の関数として、人々がどのように計画し、メタプランを行うべきかを予測します。
人々の反応時間は、情報処理の計画的な利用を反映している。
計画計画のこの定式化は、人間と機械の両方における階層的計画、状態抽象化、認知制御の機能に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2020-02-13T20:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。