論文の概要: Evaluating Few-Shot Temporal Reasoning of LLMs for Human Activity Prediction in Smart Environments
- arxiv url: http://arxiv.org/abs/2602.11176v1
- Date: Tue, 20 Jan 2026 20:58:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-15 14:54:53.727107
- Title: Evaluating Few-Shot Temporal Reasoning of LLMs for Human Activity Prediction in Smart Environments
- Title(参考訳): スマート環境下での人間活動予測のためのLLMの短時間時間推論の評価
- Authors: Maral Doctorarastoo, Katherine A. Flanigan, Mario Bergés, Christopher McComb,
- Abstract要約: 既存のデータ駆動エージェントベースのモデルは、低データ環境において苦労する。
本稿では,人間の知識に基づいて事前学習された大規模言語モデルがこのギャップを埋めるかどうかを検討する。
- 参考スコア(独自算出の注目度): 1.411614392022118
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anticipating human activities and their durations is essential in applications such as smart-home automation, simulation-based architectural and urban design, activity-based transportation system simulation, and human-robot collaboration, where adaptive systems must respond to human activities. Existing data-driven agent-based models--from rule-based to deep learning--struggle in low-data environments, limiting their practicality. This paper investigates whether large language models, pre-trained on broad human knowledge, can fill this gap by reasoning about everyday activities from compact contextual cues. We adopt a retrieval-augmented prompting strategy that integrates four sources of context--temporal, spatial, behavioral history, and persona--and evaluate it on the CASAS Aruba smart-home dataset. The evaluation spans two complementary tasks: next-activity prediction with duration estimation, and multi-step daily sequence generation, each tested with various numbers of few-shot examples provided in the prompt. Analyzing few-shot effects reveals how much contextual supervision is sufficient to balance data efficiency and predictive accuracy, particularly in low-data environments. Results show that large language models exhibit strong inherent temporal understanding of human behavior: even in zero-shot settings, they produce coherent daily activity predictions, while adding one or two demonstrations further refines duration calibration and categorical accuracy. Beyond a few examples, performance saturates, indicating diminishing returns. Sequence-level evaluation confirms consistent temporal alignment across few-shot conditions. These findings suggest that pre-trained language models can serve as promising temporal reasoners, capturing both recurring routines and context-dependent behavioral variations, thereby strengthening the behavioral modules of agent-based models.
- Abstract(参考訳): スマートホームの自動化、シミュレーションに基づくアーキテクチャと都市デザイン、アクティビティに基づく交通システムシミュレーション、人間とロボットの協調など、適応システムが人間の活動に応答しなければならないアプリケーションにおいて、人間の活動とその持続時間を予測することが不可欠である。
既存のデータ駆動エージェントベースのモデル – ルールベースからディープラーニングまで – は、低データ環境におけるストラグルであり、実用性に制限がある。
本稿では,広義の人的知識に基づいて事前学習された大規模言語モデルが,コンパクトな文脈から日常的な活動について推論することで,このギャップを埋めることができるかどうかを考察する。
我々は、時間的、空間的、行動的履歴、ペルソナの4つの情報源を統合した検索強化プロンプト戦略を採用し、CASAS Arubaスマートホームデータセット上で評価する。
評価は2つの相補的なタスク – 期間推定を伴う次のアクティビティ予測と,プロンプトに提供される多数の少数ショット例でテストされる複数ステップの日次生成 – にまたがる。
わずかなショット効果を分析することで、特に低データ環境において、データの効率と予測精度のバランスをとるのに、文脈的監督がどの程度十分であるかが明らかになる。
その結果, 大規模言語モデルでは, ゼロショット設定においても, 日常行動のコヒーレントな予測が得られ, 1~2つの実演により, 時間的キャリブレーションとカテゴリー的精度が向上することが示唆された。
いくつか例を挙げると、パフォーマンスが飽和し、リターンが減少することを示している。
シーケンスレベルの評価は、数ショット条件で一貫した時間的アライメントを確認する。
これらの結果から,事前学習した言語モデルが有望な時間的推論として機能し,反復的ルーチンと文脈依存的行動変動の両方をキャプチャし,エージェントベースモデルの行動モジュールを強化することが示唆された。
関連論文リスト
- HumanLLM: Towards Personalized Understanding and Simulation of Human Nature [72.55730315685837]
HumanLLMは個人のパーソナライズされた理解とシミュレーションのために設計された基礎モデルである。
私たちはまず、Reddit、Twitter、Blogger、Amazonといったプラットフォーム上で、現実世界のユーザデータをキュレートした大規模なコーパスであるCognitive Genomeを構築しました。
次に、多様な学習タスクを定式化し、教師付き微調整を行い、モデルの幅広い個人化された人間の行動、思考、経験を予測する。
論文 参考訳(メタデータ) (2026-01-22T09:27:27Z) - Scriboora: Rethinking Human Pose Forecasting [44.79834103607383]
本稿では,絶対的なポーズ予測のタスクにおいて,ポーズ予測アルゴリズムを広範囲に評価する。
最近の音声モデルは、ポーズ予測のタスクに効率的に適応でき、最先端の性能を向上させることができる。
論文 参考訳(メタデータ) (2025-11-19T15:58:33Z) - Training Machine Learning Models on Human Spatio-temporal Mobility Data: An Experimental Study [Experiment Paper] [0.5382679710017696]
個人レベルの人体移動予測は、感染症のモニタリング、子供、高齢者のケアへの応用に関する重要な研究のトピックとして浮上している。
機械学習モデルをトレーニングするためのベストプラクティスを決定すること。
意味情報を明示的に含めることで、モデルが生活の個々のパターンをよりよく理解し、予測を改善することができることを示す。
論文 参考訳(メタデータ) (2025-08-18T17:49:10Z) - When Does Multimodality Lead to Better Time Series Forecasting? [96.26052272121615]
このようなマルチモーダルな統合が常に利益をもたらすかどうか、どのような条件で検討する。
その結果,マルチモーダリティの利点は条件に依存していることが判明した。
我々の研究は、マルチモーダリティが予測タスクに役立つことをいつ予測できるかを理解するための厳密で定量的な基礎を提供する。
論文 参考訳(メタデータ) (2025-06-20T23:55:56Z) - If an LLM Were a Character, Would It Know Its Own Story? Evaluating Lifelong Learning in LLMs [55.8331366739144]
大規模言語モデル(LLM)における生涯学習評価のためのベンチマークであるLIFESTATE-BENCHを紹介する。
我々の事実チェック評価は、パラメトリックと非パラメトリックの両方のアプローチで、モデルの自己認識、エピソードメモリ検索、関係追跡を探索する。
論文 参考訳(メタデータ) (2025-03-30T16:50:57Z) - Inverse Dynamics Pretraining Learns Good Representations for Multitask
Imitation [66.86987509942607]
このようなパラダイムを模倣学習でどのように行うべきかを評価する。
本稿では,事前学習コーパスがマルチタスクのデモンストレーションから成り立つ環境について考察する。
逆動力学モデリングはこの設定に適していると主張する。
論文 参考訳(メタデータ) (2023-05-26T14:40:46Z) - Multi-Timescale Modeling of Human Behavior [0.18199355648379031]
本稿では,行動情報を複数の時間スケールで処理し,将来の行動を予測するLSTMネットワークアーキテクチャを提案する。
我々は、仮想Minecraftベースのテストベッドでシミュレーションした都市検索・救助シナリオで収集したデータに基づいて、アーキテクチャを評価する。
論文 参考訳(メタデータ) (2022-11-16T15:58:57Z) - Time Will Change Things: An Empirical Study on Dynamic Language
Understanding in Social Media Classification [5.075802830306718]
我々は、実験的にソーシャルメディアのNLUを動的に研究し、モデルが過去のデータに基づいてトレーニングされ、将来のテストが行われる。
自動エンコーディングと擬似ラベルが協調して、動的性の最良の堅牢性を示すことを示す。
論文 参考訳(メタデータ) (2022-10-06T12:18:28Z) - A Generative Language Model for Few-shot Aspect-Based Sentiment Analysis [90.24921443175514]
我々は、アスペクト項、カテゴリを抽出し、対応する極性を予測するアスペクトベースの感情分析に焦点を当てる。
本稿では,一方向の注意を伴う生成言語モデルを用いて,抽出タスクと予測タスクをシーケンス生成タスクに再構成することを提案する。
提案手法は,従来の最先端(BERTをベースとした)の性能を,数ショットとフルショットの設定において,大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-04-11T18:31:53Z) - Episodic Memory for Learning Subjective-Timescale Models [1.933681537640272]
モデルに基づく学習では、エージェントのモデルは、環境の連続状態間の遷移に対して一般的に定義される。
対照的に、生物学的生物の知的行動は、文脈によって異なる時間スケールを計画する能力によって特徴づけられる。
エージェントの主観的時間尺度を定義するエピソード記憶のシーケンスに基づいて、遷移力学モデルを学ぶための新しいアプローチを考案する。
論文 参考訳(メタデータ) (2020-10-03T21:55:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。