論文の概要: Improving Human Decision-Making by Discovering Efficient Strategies for
Hierarchical Planning
- arxiv url: http://arxiv.org/abs/2102.00521v1
- Date: Sun, 31 Jan 2021 19:46:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-03 04:00:49.681900
- Title: Improving Human Decision-Making by Discovering Efficient Strategies for
Hierarchical Planning
- Title(参考訳): 階層計画のための効率的な戦略発見による人的意思決定の改善
- Authors: Saksham Consul, Lovis Heindrich, Jugoslav Stojcheski, Falk Lieder
- Abstract要約: 計算資源が限られているため、効率的な計画戦略が必要です。
これらの戦略を計算する能力は、以前は非常に小さく、非常に単純な計画タスクに限られていました。
本稿では,この制限を克服できる認知型強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 0.6882042556551609
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To make good decisions in the real world people need efficient planning
strategies because their computational resources are limited. Knowing which
planning strategies would work best for people in different situations would be
very useful for understanding and improving human decision-making. But our
ability to compute those strategies used to be limited to very small and very
simple planning tasks. To overcome this computational bottleneck, we introduce
a cognitively-inspired reinforcement learning method that can overcome this
limitation by exploiting the hierarchical structure of human behavior. The
basic idea is to decompose sequential decision problems into two sub-problems:
setting a goal and planning how to achieve it. This hierarchical decomposition
enables us to discover optimal strategies for human planning in larger and more
complex tasks than was previously possible. The discovered strategies
outperform existing planning algorithms and achieve a super-human level of
computational efficiency. We demonstrate that teaching people to use those
strategies significantly improves their performance in sequential
decision-making tasks that require planning up to eight steps ahead. By
contrast, none of the previous approaches was able to improve human performance
on these problems. These findings suggest that our cognitively-informed
approach makes it possible to leverage reinforcement learning to improve human
decision-making in complex sequential decision-problems. Future work can
leverage our method to develop decision support systems that improve human
decision making in the real world.
- Abstract(参考訳): 現実世界で良い意思決定を行うには、計算資源が限られているため、効率的な計画戦略が必要です。
さまざまな状況の人々に最も適した計画戦略を知ることは、人間の意思決定を理解し、改善するのに非常に役立ちます。
しかし、これらの戦略を計算する能力は、以前は非常に小さく、非常に単純な計画タスクに限られていました。
この計算ボトルネックを克服するために,人間の行動の階層構造を活用することにより,この制限を克服できる認知型強化学習手法を導入する。
基本的な考え方は、逐次的な決定問題を2つのサブ問題に分割することだ。
この階層的な分解によって、以前よりも大きく複雑なタスクで、人間の計画に最適な戦略を見つけることができます。
発見された戦略は、既存の計画アルゴリズムを上回り、超人的な計算効率を達成する。
これらの戦略を使用するように教えることで、最大8ステップの計画を必要とする意思決定タスクにおけるパフォーマンスが大幅に向上することを示す。
対照的に、以前のアプローチでは、これらの問題に対する人間のパフォーマンスを改善することはできなかった。
これらの結果から, 複雑な逐次的意思決定において, 強化学習を活用し, 人間の意思決定を改善することができることが示唆された。
今後,この手法を活用し,実世界での意思決定を改善する意思決定支援システムの開発が期待できる。
関連論文リスト
- Learning to Assist Humans without Inferring Rewards [65.28156318196397]
我々は、エンパワーメントのレンズを通して支援を研究する先行研究に基づいて構築する。
補助剤は、人間の行動の影響を最大化することを目的としている。
これらの表現は、先行研究と類似したエンパワーメントの概念を推定する。
論文 参考訳(メタデータ) (2024-11-04T21:31:04Z) - Leveraging automatic strategy discovery to teach people how to select better projects [0.9821874476902969]
個人や組織の決定は、規範的な決定戦略が現実の世界であまりにも要求されているため、過小評価されることが多い。
最近の研究は、人工知能を利用して規範的な意思決定戦略を発見し、教えることによって、いくつかのエラーを防ぐことができることを示唆している。
この記事は、このアプローチを現実の意思決定問題、すなわちプロジェクト選択に拡張する最初のものです。
論文 参考訳(メタデータ) (2024-06-06T13:51:44Z) - Simple Hierarchical Planning with Diffusion [54.48129192534653]
拡散に基づく生成法は、オフラインデータセットによる軌跡のモデリングに有効であることが証明されている。
階層型および拡散型プランニングの利点を組み合わせた高速かつ驚くほど効果的な計画手法である階層型ディフューザを導入する。
我々のモデルは、より高いレベルで「ジャンピー」な計画戦略を採用しており、より大きな受容場を持つことができるが、計算コストは低い。
論文 参考訳(メタデータ) (2024-01-05T05:28:40Z) - Optimising Human-AI Collaboration by Learning Convincing Explanations [62.81395661556852]
本研究では,人間による意思決定によって安全を保ちながら協調的なシステムを構築する手法を提案する。
Ardentは、説明のための個人の好みに適応することで、効率的で効果的な意思決定を可能にする。
論文 参考訳(メタデータ) (2023-11-13T16:00:16Z) - Risk-reducing design and operations toolkit: 90 strategies for managing
risk and uncertainty in decision problems [65.268245109828]
本稿では,このような戦略のカタログを開発し,それらのためのフレームワークを開発する。
高い不確実性のために難解であるように見える決定問題に対して、効率的な応答を提供する、と論じている。
次に、多目的最適化を用いた決定理論にそれらを組み込む枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-06T16:14:32Z) - An intelligent tutor for planning in large partially observable environments [0.8739101659113157]
本研究では,部分的に観測可能な環境下での計画のための知的チューターを開発し,評価する。
計画戦略を教えるための知的家庭教師と比べ、この新しい知的家庭教師は2つの革新を組み合わせている。
330人の参加者による事前登録実験では、新しいインテリジェントチューターは、部分的に観察可能な環境で良い判断を下す能力を向上させるのに非常に効果的であることが示された。
論文 参考訳(メタデータ) (2023-02-06T13:57:08Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - Boosting human decision-making with AI-generated decision aids [8.373151777137792]
我々は,従来の手法の出力を手続き的命令に変換するアルゴリズムを開発した。
実験の結果、これらの自動意思決定は、道路旅行計画や住宅ローン選択における人々のパフォーマンスを著しく向上させることがわかった。
これらの結果は、AIによる強化が、現実世界における人間の意思決定を改善する可能性があることを示唆している。
論文 参考訳(メタデータ) (2022-03-05T15:57:20Z) - Procedure Planning in Instructional Videosvia Contextual Modeling and
Model-based Policy Learning [114.1830997893756]
本研究は,実生活ビデオにおける目標指向アクションを計画するモデルを学習することに焦点を当てる。
本研究では,ベイズ推論とモデルに基づく模倣学習を通して,人間の行動のモデル化を行う新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-05T01:06:53Z) - Improving Human Sequential Decision-Making with Reinforcement Learning [29.334511328067777]
トレースデータから"ベストプラクティス"を抽出できる新しい機械学習アルゴリズムを設計する。
我々のアルゴリズムは、労働者の行動と最適な政策によって取られた行動のギャップを最もうまく埋めるヒントを選択する。
実験の結果,提案アルゴリズムが生成したチップは人体の性能を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-08-19T02:57:58Z) - Automatic Discovery of Interpretable Planning Strategies [9.410583483182657]
我々は、慣用的ポリシーを単純かつ解釈可能な記述に変換する方法であるAI-Interpretを紹介する。
フローチャートとしてAI-Interpretが生み出す決定ルールを守れば、人々の計画戦略や意思決定は大幅に改善される。
論文 参考訳(メタデータ) (2020-05-24T12:24:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。