論文の概要: Preemptive Solving of Future Problems: Multitask Preplay in Humans and Machines
- arxiv url: http://arxiv.org/abs/2507.05561v1
- Date: Tue, 08 Jul 2025 00:55:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.463316
- Title: Preemptive Solving of Future Problems: Multitask Preplay in Humans and Machines
- Title(参考訳): 今後の課題のプリエンプティブ解決:人間と機械におけるマルチタスク・プレプレイ
- Authors: Wilka Carvalho, Sam Hall-McMaster, Honglak Lee, Samuel J. Gershman,
- Abstract要約: Multitask Preplayは、あるタスクでの体験を"preplay"の出発点として再生する新しいアルゴリズムである
最初に、マルチタスクのプリプレイは、人間が小さなグリッドワールドにおいて、アクセス可能だが追求されていないタスクにどのように一般化するかをよりよく予測することを示した。
次に、これらの予測を、部分的に観察可能な2Dマインクラフト環境であるCraftaxに一般化することを示す。
- 参考スコア(独自算出の注目度): 46.05942799374219
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans can pursue a near-infinite variety of tasks, but typically can only pursue a small number at the same time. We hypothesize that humans leverage experience on one task to preemptively learn solutions to other tasks that were accessible but not pursued. We formalize this idea as Multitask Preplay, a novel algorithm that replays experience on one task as the starting point for "preplay" -- counterfactual simulation of an accessible but unpursued task. Preplay is used to learn a predictive representation that can support fast, adaptive task performance later on. We first show that, compared to traditional planning and predictive representation methods, multitask preplay better predicts how humans generalize to tasks that were accessible but not pursued in a small grid-world, even when people didn't know they would need to generalize to these tasks. We then show these predictions generalize to Craftax, a partially observable 2D Minecraft environment. Finally, we show that Multitask Preplay enables artificial agents to learn behaviors that transfer to novel Craftax worlds sharing task co-occurrence structure. These findings demonstrate that Multitask Preplay is a scalable theory of how humans counterfactually learn and generalize across multiple tasks; endowing artificial agents with the same capacity can significantly improve their performance in challenging multitask environments.
- Abstract(参考訳): 人間は、ほぼ無限のタスクを追求できるが、通常は少数のタスクのみを同時に追求することができる。
我々は、人間があるタスクにおける経験を活用して、アクセス可能だが追求されていない他のタスクに対するソリューションを事前に学習する、という仮説を立てた。
このアイデアをMultitask Preplayとして形式化します。これは、あるタスクでの経験を"プリプレイ"の出発点として再生する新しいアルゴリズムです。
Preplayは、高速で適応的なタスクパフォーマンスをサポートする予測表現を学ぶために使用される。
まず、従来の計画手法や予測表現手法と比較して、マルチタスクプリプレイは、人々がこれらのタスクに一般化する必要があることを知らなかったとしても、小さなグリッドの世界において、人間がアクセス可能だが追求されていないタスクに対して、人間がどのように一般化するかをよりよく予測することを示した。
次に、これらの予測を、部分的に観察可能な2Dマインクラフト環境であるCraftaxに一般化することを示す。
最後に,Multitask Preplayは,タスク共起構造を共有する新しいCraftaxの世界へ移行する行動の学習を可能にする。
これらの結果から、マルチタスク・プレプレイは、人間が複数のタスクに対して反現実的に学習し、一般化する方法のスケーラブルな理論であることが明らかとなった。
関連論文リスト
- Task Compass: Scaling Multi-task Pre-training with Task Prefix [122.49242976184617]
既存の研究では、大規模教師付きタスクによるマルチタスク学習がタスク間の負の効果に悩まされていることが示されている。
タスク間の関係を探索するために,タスクプレフィックスガイド付きマルチタスク事前学習フレームワークを提案する。
我々のモデルは、幅広いタスクの強力な基盤バックボーンとして機能するだけでなく、タスク関係を分析するための探索ツールとしても実現可能である。
論文 参考訳(メタデータ) (2022-10-12T15:02:04Z) - Unified Multimodal Pre-training and Prompt-based Tuning for
Vision-Language Understanding and Generation [86.26522210882699]
視覚言語理解と生成のための統一型マルチモーダル事前学習を提案する。
提案したUniVLは、理解タスクと生成タスクの両方を扱うことができる。
実験の結果,同じモデルを用いた場合,理解タスクと生成タスクとの間にはトレードオフがあることが判明した。
論文 参考訳(メタデータ) (2021-12-10T14:59:06Z) - Towards More Generalizable One-shot Visual Imitation Learning [81.09074706236858]
汎用ロボットは、幅広いタスクを習得し、過去の経験を生かして、新しいタスクを素早く学ぶことができるべきである。
ワンショット模倣学習(OSIL)は、専門家のデモンストレーションでエージェントを訓練することで、この目標にアプローチする。
我々は、より野心的なマルチタスク設定を調査することで、より高度な一般化能力を追求する。
論文 参考訳(メタデータ) (2021-10-26T05:49:46Z) - VLM: Task-agnostic Video-Language Model Pre-training for Video
Understanding [78.28397557433544]
本稿では,タスクに依存しないマルチモーダル事前学習手法を提案する。
実験の結果,従来の手法よりも広い範囲のタスクに対して強い性能を示し,タスク固有の事前学習よりも優れていた。
論文 参考訳(メタデータ) (2021-05-20T19:13:27Z) - COG: Connecting New Skills to Past Experience with Offline Reinforcement
Learning [78.13740204156858]
我々は、動的プログラミングによって新しいスキルを拡張するために、事前データを再利用できることを示します。
我々は、新しいタスクを解決するために、以前のデータセットに見られるいくつかの動作をチェーンすることで、アプローチの有効性を実証する。
我々は、高次元画像観察を低レベルのロボット制御コマンドにマッピングし、エンドツーエンドでポリシーを訓練する。
論文 参考訳(メタデータ) (2020-10-27T17:57:29Z) - Learning to Play by Imitating Humans [8.209859328381269]
遠隔操作型プレイデータ上での自己監督制御により,多様なスキルの獲得が可能であることを示す。
比較的少量の人間の遊びに対して行動的クローン化ポリシーを訓練することにより、我々は大量のクローン化プレイデータを自律的に生成する。
この拡張データセットでトレーニングされた汎用目標条件ポリシーは、本来の人的データでトレーニングされた政策よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2020-06-11T23:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。