論文の概要: An intelligent tutor for planning in large partially observable environments
- arxiv url: http://arxiv.org/abs/2302.02785v2
- Date: Thu, 6 Jun 2024 13:29:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-08 01:19:21.632035
- Title: An intelligent tutor for planning in large partially observable environments
- Title(参考訳): 大規模部分観測可能な環境における計画のためのインテリジェントチューター
- Authors: Lovis Heindrich, Saksham Consul, Falk Lieder,
- Abstract要約: 本研究では,部分的に観測可能な環境下での計画のための知的チューターを開発し,評価する。
計画戦略を教えるための知的家庭教師と比べ、この新しい知的家庭教師は2つの革新を組み合わせている。
330人の参加者による事前登録実験では、新しいインテリジェントチューターは、部分的に観察可能な環境で良い判断を下す能力を向上させるのに非常に効果的であることが示された。
- 参考スコア(独自算出の注目度): 0.8739101659113157
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI can not only outperform people in many planning tasks, but it can also teach them how to plan better. A recent and promising approach to improving human decision-making is to create intelligent tutors that utilize AI to discover and teach optimal planning strategies automatically. Prior work has shown that this approach can improve planning in artificial, fully observable planning tasks. Unlike these artificial tasks, the world is only partially observable. To bridge this gap, we developed and evaluated the first intelligent tutor for planning in partially observable environments. Compared to previous intelligent tutors for teaching planning strategies, this novel intelligent tutor combines two innovations: 1) a new metareasoning algorithm for discovering optimal planning strategies for large, partially observable environments, and 2) scaffolding the learning processing by having the learner choose from an increasing larger set of planning operations in increasingly larger planning problems. We found that our new strategy discovery algorithm is superior to the state-of-the-art. A preregistered experiment with 330 participants demonstrated that the new intelligent tutor is highly effective at improving people's ability to make good decisions in partially observable environments. This suggests our human-centered tutoring approach can successfully boost human planning in complex, partially observable sequential decision problems, a promising step towards using AI-powered intelligent tutors to improve human planning in the real world.
- Abstract(参考訳): AIは多くの計画タスクで人より優れているだけでなく、よりよい計画の仕方も教えることができる。
人間の意思決定を改善するための最近の有望なアプローチは、AIを利用して最適な計画戦略を発見し、自動的に教えるインテリジェントな家庭教師を作ることである。
これまでの研究によると、このアプローチは人工的に完全に観測可能な計画タスクにおける計画を改善することができる。
これらの人工的なタスクとは異なり、世界は部分的にしか観察できない。
このギャップを埋めるために、我々は、部分的に観測可能な環境における計画のための最初の知的チューターを開発し、評価した。
計画戦略を教えるための知的家庭教師と比較して、この新しい知的家庭教師は2つの革新を組み合わせている。
1)大規模で部分的に観測可能な環境のための最適な計画戦略を発見するための新しいメタ推論アルゴリズム
2) より大規模な計画課題において, より大規模な計画作業から学習者に選択させることにより, 学習処理の足場を構築する。
我々の新しい戦略発見アルゴリズムは最先端技術よりも優れていることがわかった。
330人の参加者による事前登録実験では、新しいインテリジェントチューターは、部分的に観察可能な環境で良い判断を下す能力を向上させるのに非常に効果的であることが示された。
これは、私たちの人間中心の家庭教師アプローチが、複雑で部分的に観察可能なシーケンシャルな意思決定問題において、人間の計画を促進することができることを示唆している。
関連論文リスト
- Leveraging automatic strategy discovery to teach people how to select better projects [0.9821874476902969]
個人や組織の決定は、規範的な決定戦略が現実の世界であまりにも要求されているため、過小評価されることが多い。
最近の研究は、人工知能を利用して規範的な意思決定戦略を発見し、教えることによって、いくつかのエラーを防ぐことができることを示唆している。
この記事は、このアプローチを現実の意思決定問題、すなわちプロジェクト選択に拡張する最初のものです。
論文 参考訳(メタデータ) (2024-06-06T13:51:44Z) - Intelligent Execution through Plan Analysis [11.771743106780102]
計画は世界について仮定する。
計画を実行する場合、通常、仮定は満たされない。
代わりに私たちは、ポジティブな影響や、より良い計画を見つける機会に重点を置いています。
いくつかのパラダイム的なロボットタスクの実験は、アプローチが標準的な計画戦略よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-18T18:23:36Z) - Towards Goal-oriented Intelligent Tutoring Systems in Online Education [69.06930979754627]
目標指向知能チューニングシステム(GITS)という新しいタスクを提案する。
GITSは,演習や評価のカスタマイズを戦略的に計画することで,学生の指定概念の習得を可能にすることを目的としている。
PAI(Planning-Assessment-Interaction)と呼ばれるグラフに基づく新しい強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-03T12:37:16Z) - Thinker: Learning to Plan and Act [18.425843346728648]
思考アルゴリズムは環境を世界モデルで包み、世界モデルと対話するために設計された新しいアクションを導入する。
本研究では,ソコバンとアタリ2600ベンチマークを用いて,実験結果を用いてアルゴリズムの有効性を実証する。
論文 参考訳(メタデータ) (2023-07-27T16:40:14Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - Understanding Decision-Time vs. Background Planning in Model-Based
Reinforcement Learning [56.50123642237106]
一般的な2つのアプローチは、意思決定時計画とバックグラウンド計画である。
本研究は、これらの2つの計画スタイルのうちの1つが、どの条件で、どの設定が他の方法よりも優れているかを理解することに関心がある。
全体としては、意思決定時計画は、古典的インスタンス化において、背景計画と同等に動作しないが、現代のインスタンス化では、背景計画よりも同等かそれ以上に実行可能であることを示唆している。
論文 参考訳(メタデータ) (2022-06-16T20:48:19Z) - Have I done enough planning or should I plan more? [0.7734726150561086]
この能力は,学習機構を逆エンジニアリングすることで得られることを示す。
計画のコストと利益に対して、どれだけの計画を実行したか、すぐに適応できることに気付きました。
その結果,計画の量を調整するメタ認知能力は,政策段階のメカニズムによって学習される可能性が示唆された。
論文 参考訳(メタデータ) (2022-01-03T17:11:07Z) - Procedure Planning in Instructional Videosvia Contextual Modeling and
Model-based Policy Learning [114.1830997893756]
本研究は,実生活ビデオにおける目標指向アクションを計画するモデルを学習することに焦点を当てる。
本研究では,ベイズ推論とモデルに基づく模倣学習を通して,人間の行動のモデル化を行う新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-05T01:06:53Z) - Improving Human Decision-Making by Discovering Efficient Strategies for
Hierarchical Planning [0.6882042556551609]
計算資源が限られているため、効率的な計画戦略が必要です。
これらの戦略を計算する能力は、以前は非常に小さく、非常に単純な計画タスクに限られていました。
本稿では,この制限を克服できる認知型強化学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-31T19:46:00Z) - Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。
我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。
Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文 参考訳(メタデータ) (2020-05-12T17:59:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。