論文の概要: Humans decompose tasks by trading off utility and computational cost
- arxiv url: http://arxiv.org/abs/2211.03890v1
- Date: Mon, 7 Nov 2022 22:45:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 16:20:22.715376
- Title: Humans decompose tasks by trading off utility and computational cost
- Title(参考訳): 人間はユーティリティと計算コストのトレードオフによってタスクを分解する
- Authors: Carlos G. Correa, Mark K. Ho, Frederick Callaway, Nathaniel D. Daw,
Thomas L. Griffiths
- Abstract要約: 人間の振る舞いは、タスクの精巧な分解を目標、サブゴール、低レベルのアクションに計画することから生まれる。
本稿では,タスク分解の規範的枠組みを,計画全体のコスト削減のためにタスクを分解するという単純な考え方に基づいて提案し,評価する。
- 参考スコア(独自算出の注目度): 10.366866096121347
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human behavior emerges from planning over elaborate decompositions of tasks
into goals, subgoals, and low-level actions. How are these decompositions
created and used? Here, we propose and evaluate a normative framework for task
decomposition based on the simple idea that people decompose tasks to reduce
the overall cost of planning while maintaining task performance. Analyzing
11,117 distinct graph-structured planning tasks, we find that our framework
justifies several existing heuristics for task decomposition and makes
predictions that can be distinguished from two alternative normative accounts.
We report a behavioral study of task decomposition ($N=806$) that uses 30
randomly sampled graphs, a larger and more diverse set than that of any
previous behavioral study on this topic. We find that human responses are more
consistent with our framework for task decomposition than alternative normative
accounts and are most consistent with a heuristic -- betweenness centrality --
that is justified by our approach. Taken together, our results provide new
theoretical insight into the computational principles underlying the
intelligent structuring of goal-directed behavior.
- Abstract(参考訳): 人間の振る舞いは、タスクの精巧な分解を目標、サブゴール、低レベルのアクションに計画することから生まれる。
これらの分解はどのように作成され、使用されるか?
本稿では,タスク性能を維持しつつ,計画全体のコストを削減するために,タスクを分解する,というシンプルな考え方に基づいて,タスク分解の規範的枠組みを提案し,評価する。
11,117の異なるグラフ構造化計画タスクを分析し、我々のフレームワークはタスク分解のためのいくつかの既存のヒューリスティックを正当化し、2つの代替規範的アカウントと区別できる予測を行う。
本稿では,30個のランダムサンプリンググラフを用いたタスク分解(N=806$)の行動学的研究について報告する。
人間の反応は、代替の規範的アカウントよりもタスク分解の枠組みと一致しており、我々のアプローチによって正当化されるヒューリスティックな-相互中心性-と最も一致している。
その結果,目標指向行動の知的構造化の基礎となる計算原理に関する新たな理論的知見が得られた。
関連論文リスト
- Learning Top-k Subtask Planning Tree based on Discriminative Representation Pre-training for Decision Making [9.302910360945042]
複雑な現実世界のタスクから抽出された事前知識による計画は、人間が正確な決定を行うために不可欠である。
マルチエンコーダと個別予測器を導入し、簡単なサブタスクのための十分なデータからタスク固有表現を学習する。
また、注意機構を用いてトップkのサブタスク計画木を生成し、未確認タスクの複雑な決定を導くためにサブタスク実行計画をカスタマイズする。
論文 参考訳(メタデータ) (2023-12-18T09:00:31Z) - Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement Learning [83.41487567765871]
Skipperはモデルベースの強化学習フレームワークである。
これは、与えられたタスクをより小さく、より管理しやすいサブタスクに自動的に一般化する。
環境の関連部分には、スパースな意思決定と集中した抽象化を可能にする。
論文 参考訳(メタデータ) (2023-09-30T02:25:18Z) - POMRL: No-Regret Learning-to-Plan with Increasing Horizons [43.693739167594295]
オンラインメタ強化学習環境におけるモデル不確実性の下での計画課題について検討する。
本稿では,タスク間の基盤構造をメタラーニングし,タスクごとの計画を立てるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-30T03:09:45Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Multi-task Learning of Order-Consistent Causal Graphs [59.9575145128345]
我々は、$K関連ガウス非巡回グラフ(DAG)の発見問題を考える。
マルチタスク学習環境下では, 線形構造方程式モデルを学習するためのMLE ($l_1/l$-regularized maximum chance estimator) を提案する。
理論的には、関係するタスクにまたがるデータを活用することで、因果順序を復元する際のサンプルの複雑さをより高めることができることを示す。
論文 参考訳(メタデータ) (2021-11-03T22:10:18Z) - An Integrated Dynamic Method for Allocating Roles and Planning Tasks for
Mixed Human-Robot Teams [0.0]
本稿では,混合ロボットチームにおけるタスクの計画と割当のための新しい統合的動的手法を提案する。
振舞いツリーの定式化は、時間的制約と論理的制約のある異なるタスクの複合体として単一のジョブをエンコードすることを可能にする。
論文 参考訳(メタデータ) (2021-05-25T16:10:30Z) - Resource-rational Task Decomposition to Minimize Planning Costs [10.178049366671505]
人々はしばしば階層的に計画する。つまり、タスクのモノリシックな表現を計画するのではなく、タスクを単純なサブタスクに分解し、それを達成する計画を立てる。
本稿では,環境の構造や計画アルゴリズムを考慮し,限られた認知資源の効率的な活用を容易にする方法でタスクを分解することを提案する。
我々の説明では、サブタスクの特定方法の規範的な説明に加えて、リソース・レーショナルな表現を用いて、人々がどのように推論し、計画し、行動するかを研究するための枠組みも提供しています。
論文 参考訳(メタデータ) (2020-07-27T20:59:26Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z) - Hierarchical Reinforcement Learning as a Model of Human Task
Interleaving [60.95424607008241]
我々は、強化学習によって駆動される監督制御の階層モデルを開発する。
このモデルは、タスクインターリービングの既知の経験的効果を再現する。
その結果、階層的RLがタスクインターリービングのもっともらしいモデルとして支持された。
論文 参考訳(メタデータ) (2020-01-04T17:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。