論文の概要: Early Prediction of Future Behavioral Strategy from Process Traces
- arxiv url: http://arxiv.org/abs/2605.30550v1
- Date: Thu, 28 May 2026 20:33:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.22168
- Title: Early Prediction of Future Behavioral Strategy from Process Traces
- Title(参考訳): プロセストレースによる将来の行動戦略の早期予測
- Authors: Robert Kasumba, Dennis Barbour, Chien-Ju Ho,
- Abstract要約: 本研究では,部分的ソースタスクプロセストレースが,保持対象タスクにおける戦略を予測するトランスファー可能な人物レベルの構造を明らかにすることができるかどうかを考察する。
本稿では,タスク固有のトレースを符号化し,タスク間の予測を行うプロセスレベル潜在変数モデル(PLVM)を提案する。
- 参考スコア(独自算出の注目度): 8.829405709590658
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptive systems often need to make task-specific decisions about people from limited evidence: a tutor may need to anticipate how a learner will approach a new problem, a game may need to adapt when a player enters a new level, and a human-AI system may need to infer whether a partner will persist with a plan or switch goals. These decisions depend on person-level tendencies that shape how people solve related tasks, but such tendencies are difficult to infer from standard behavioral evidence. One approach is to use aggregate outcome summaries, such as scores, completion rates, or productivity; these summaries are compact and available across tasks, but can collapse distinct behavioral processes into similar outcomes. Another approach is to use process-level traces, which record how behavior unfolds; however, process modeling within one task can entangle stable person-level tendencies with task-specific layout and affordances. In this work, we study early cross-task behavioral inference: whether partial source-task process traces can reveal transferable person-level structure that predicts strategy in a held-out target task. We introduce a Process-Level Latent Variable Model (PLVM), which encodes task-specific traces and fuses them into a shared person-level latent representation for cross-task prediction. In PowerWash Simulator, a naturalistic telemetry dataset of human gameplay, PLVM uses partial traces from two cleaning tasks to predict locally persistent Zone Planner behavior versus frequent Zone Hopper behavior in the held-out Fire Station level. Controlled simulations with known latent types show that cross-task fusion helps when source tasks reveal complementary dimensions of a shared latent process. These results suggest that process-level cross-task modeling can support early prediction of target-task strategy when observing sufficient target-task behavior is impractical.
- Abstract(参考訳): 教師は学習者が新しい問題にどのようにアプローチするかを予測し、ゲームはプレイヤーが新しいレベルに入ったときに適応する必要がある。
これらの決定は、人々が関連する課題をどう解決するかを形作る人レベルの傾向に依存するが、そのような傾向は標準的な行動証拠から推測することは困難である。
ひとつのアプローチは、スコア、完了率、生産性などの集計結果の要約を使用することである。
もう一つのアプローチは、プロセスレベルのトレースを使用することで、振る舞いがどのように展開されるかを記録できるが、一方のタスク内でのプロセスモデリングは、安定した人レベルの傾向をタスク固有のレイアウトと余裕で絡み合わせることができる。
本研究では,早期のクロスタスク行動推定について検討する:部分的ソースタスクプロセストレースが,保持対象タスクにおける戦略を予測するトランスファー可能な人物レベルの構造を明らかにすることができるか。
本稿では,タスク固有のトレースを符号化し,タスク間の予測を行うプロセスレベル潜在変数モデル(PLVM)を提案する。
人間のゲームプレイの自然なテレメトリデータセットであるPowerWash Simulatorでは、PLVMは2つのクリーニングタスクから部分的トレースを使用して、常設の消防署レベルでのゾーンプランナーの振る舞いと頻繁なゾーンホッパーの振る舞いを予測する。
既知の潜在型を持つ制御されたシミュレーションは、ソースタスクが共有潜在型プロセスの相補的な次元を明らかにするときに、クロスタスク融合が役に立つことを示している。
これらの結果から, プロセスレベルのクロスタスクモデリングは, 十分に標的タスクの振る舞いを観察することが現実的でない場合に, ターゲットタスク戦略の早期予測を支援することが示唆された。
関連論文リスト
- Zero-Shot Whole-Body Humanoid Control via Behavioral Foundation Models [71.34520793462069]
教師なし強化学習(RL)は、複雑な環境下で幅広い下流タスクを解くことができる事前学習エージェントを目標としている。
本稿では,ラベルのない行動データセットからトラジェクトリを模倣するための,教師なしRLの正規化アルゴリズムを提案する。
我々は,この手法の有効性を,挑戦的なヒューマノイド制御問題において実証する。
論文 参考訳(メタデータ) (2025-04-15T10:41:11Z) - GenPlan: Generative Sequence Models as Adaptive Planners [0.0]
シーケンスモデルは、以前に収集されたデモを活用することで、行動計画において顕著な成功を収めた。
しかし、特にプランナーが目に見えない制約やタスクに適応しなければならない場合、マルチタスクミッションの解決は重要な課題である。
本稿では,適応型プランナのための離散フローモデルGenPlanを提案する。
論文 参考訳(メタデータ) (2024-12-11T17:32:33Z) - Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - POMRL: No-Regret Learning-to-Plan with Increasing Horizons [43.693739167594295]
オンラインメタ強化学習環境におけるモデル不確実性の下での計画課題について検討する。
本稿では,タスク間の基盤構造をメタラーニングし,タスクごとの計画を立てるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-30T03:09:45Z) - Task Compass: Scaling Multi-task Pre-training with Task Prefix [122.49242976184617]
既存の研究では、大規模教師付きタスクによるマルチタスク学習がタスク間の負の効果に悩まされていることが示されている。
タスク間の関係を探索するために,タスクプレフィックスガイド付きマルチタスク事前学習フレームワークを提案する。
我々のモデルは、幅広いタスクの強力な基盤バックボーンとして機能するだけでなく、タスク関係を分析するための探索ツールとしても実現可能である。
論文 参考訳(メタデータ) (2022-10-12T15:02:04Z) - An Evolutionary Approach to Dynamic Introduction of Tasks in Large-scale
Multitask Learning Systems [4.675744559395732]
マルチタスク学習は、複数のタスクから学習できるモデルが知識伝達によってより良い品質と効率を達成すると仮定する。
最先端のMLモデルは、タスクごとに高いカスタマイズに依存し、タスクの数をスケールするのではなく、サイズとデータスケールを活用する。
本稿では,大規模マルチタスクモデルを生成でき,新しいタスクの動的かつ連続的な追加を支援する進化的手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T13:10:47Z) - On Steering Multi-Annotations per Sample for Multi-Task Learning [79.98259057711044]
マルチタスク学習の研究はコミュニティから大きな注目を集めている。
目覚ましい進歩にもかかわらず、異なるタスクを同時に学習するという課題はまだ検討されていない。
従来の研究は、異なるタスクから勾配を修正しようとするが、これらの手法はタスク間の関係の主観的な仮定を与え、修正された勾配はより正確でないかもしれない。
本稿では,タスク割り当てアプローチによってこの問題に対処する機構であるタスク割当(STA)を紹介し,各サンプルをランダムにタスクのサブセットに割り当てる。
さらなる進展のために、我々は全てのタスクを反復的に割り当てるためにInterleaved Task Allocation(ISTA)を提案する。
論文 参考訳(メタデータ) (2022-03-06T11:57:18Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - Hierarchical Reinforcement Learning as a Model of Human Task
Interleaving [60.95424607008241]
我々は、強化学習によって駆動される監督制御の階層モデルを開発する。
このモデルは、タスクインターリービングの既知の経験的効果を再現する。
その結果、階層的RLがタスクインターリービングのもっともらしいモデルとして支持された。
論文 参考訳(メタデータ) (2020-01-04T17:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。