論文の概要: ProMemAssist: Exploring Timely Proactive Assistance Through Working Memory Modeling in Multi-Modal Wearable Devices
- arxiv url: http://arxiv.org/abs/2507.21378v1
- Date: Mon, 28 Jul 2025 23:02:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.368558
- Title: ProMemAssist: Exploring Timely Proactive Assistance Through Working Memory Modeling in Multi-Modal Wearable Devices
- Title(参考訳): ProMemAssist: マルチモーダルウェアラブルデバイスにおけるワーキングメモリモデリングによるタイムリーなアクティブアシストの探索
- Authors: Kevin Pu, Ting Zhang, Naveen Sendhilnathan, Sebastian Freitag, Raj Sodhi, Tanya Jonker,
- Abstract要約: 本稿では,ユーザのワーキングメモリ(WM)をリアルタイムにモデル化するスマートグラスシステムであるProMemAssistを紹介する。
このWMモデルは、援助の値と割り込みコストのバランスをとるタイミング予測器に通知する。
- 参考スコア(独自算出の注目度): 4.045645290003876
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Wearable AI systems aim to provide timely assistance in daily life, but existing approaches often rely on user initiation or predefined task knowledge, neglecting users' current mental states. We introduce ProMemAssist, a smart glasses system that models a user's working memory (WM) in real-time using multi-modal sensor signals. Grounded in cognitive theories of WM, our system represents perceived information as memory items and episodes with encoding mechanisms, such as displacement and interference. This WM model informs a timing predictor that balances the value of assistance with the cost of interruption. In a user study with 12 participants completing cognitively demanding tasks, ProMemAssist delivered more selective assistance and received higher engagement compared to an LLM baseline system. Qualitative feedback highlights the benefits of WM modeling for nuanced, context-sensitive support, offering design implications for more attentive and user-aware proactive agents.
- Abstract(参考訳): ウェアラブルAIシステムは、日々の生活にタイムリーな支援を提供することを目的としているが、既存のアプローチは、しばしばユーザの現在の精神状態を無視して、ユーザの開始や事前に定義されたタスク知識に依存している。
本稿では,マルチモーダルセンサ信号を用いてユーザのワーキングメモリ(WM)をリアルタイムにモデル化するスマートグラスシステムProMemAssistを紹介する。
WMの認知理論に基づいて,認識情報を記憶項目やエピソードとして表現する。
このWMモデルは、援助の値と割り込みコストのバランスをとるタイミング予測器に通知する。
認知的要求タスクを完了した12人の被験者を対象にしたユーザスタディにおいて, ProMemAssistは, LLMベースラインシステムと比較して, より選択的に支援を行い, より高いエンゲージメントを得た。
質的なフィードバックは、ニュアンスでコンテキストに敏感なサポートのためのWMモデリングの利点を強調し、より注意深いユーザ対応のプロアクティブエージェントに設計上の意味を提供する。
関連論文リスト
- MemOS: A Memory OS for AI System [116.87568350346537]
大規模言語モデル(LLM)は、人工知能(AGI)にとって不可欠な基盤となっている。
既存のモデルは、主に静的パラメータと短命なコンテキスト状態に依存しており、ユーザの好みを追跡したり、長い期間にわたって知識を更新する能力を制限する。
MemOSはメモリを管理可能なシステムリソースとして扱うメモリオペレーティングシステムである。
論文 参考訳(メタデータ) (2025-07-04T17:21:46Z) - FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.89792845476579]
本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。
このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文 参考訳(メタデータ) (2025-06-18T17:06:28Z) - AI-based Wearable Vision Assistance System for the Visually Impaired: Integrating Real-Time Object Recognition and Contextual Understanding Using Large Vision-Language Models [0.0]
本稿では,音のビープ機構を通じてユーザに対してリアルタイムフィードバックを提供するために,人工知能(AI)技術を用いたウェアラブル視覚支援システムを提案する。
大規模視覚言語モデル(LVLM)を用いたユーザ環境におけるオブジェクトの詳細な記述を提供する。
論文 参考訳(メタデータ) (2024-12-28T07:26:39Z) - InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio Interactions [104.90258030688256]
本研究は,ストリーミング映像とオーディオ入力とのリアルタイムインタラクションを実現するために,非絡み合いのストリーミング知覚,推論,メモリ機構を導入している。
このプロジェクトは人間のような認知をシミュレートし、多モーダルな大規模言語モデルが時間とともに継続的かつ適応的なサービスを提供できるようにする。
論文 参考訳(メタデータ) (2024-12-12T18:58:30Z) - Unsupervised Representation Learning of Complex Time Series for Maneuverability State Identification in Smart Mobility [0.0]
スマートモビリティでは、操縦パターンのような行動の時間的ダイナミクスを提供する上で、MSSは重要な役割を果たす。
本研究では,センサを用いた車両から収集したMSSデータのモデル化に関わる課題に対処することを目的とする。
我々の目標は、スマートモビリティにおける操作状態の特定における2つの異なる教師なし表現学習手法の有効性を検討することである。
論文 参考訳(メタデータ) (2024-08-26T15:16:18Z) - PrISM-Observer: Intervention Agent to Help Users Perform Everyday Procedures Sensed using a Smartwatch [43.41204564594764]
PrISM-Observerはスマートウォッチベースのコンテキスト対応リアルタイム介入システムで、エラーを防止して日常的なタスクをサポートする。
情報を探さなければならない従来のシステムとは異なり、エージェントはユーザーの行動を観察し、積極的に介入する。
論文 参考訳(メタデータ) (2024-07-23T18:38:07Z) - Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。
イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。
LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文 参考訳(メタデータ) (2024-06-09T21:58:32Z) - Future Aware Safe Active Learning of Time Varying Systems using Gaussian Processes [8.678546901075984]
本稿では,時間変動システムに適した安全な能動学習フレームワークを提案する。
時間認識型平均二乗予測誤差(T-IMSPE)法は,現在および将来の状態に対する後方分散を最小化する。
論文 参考訳(メタデータ) (2024-05-17T07:09:52Z) - Temporal Memory Relation Network for Workflow Recognition from Surgical
Video [53.20825496640025]
本研究では, 長期および多スケールの時間パターンを関連づける, エンドツーエンドの時間メモリ関係ネットワーク (TMNet) を提案する。
我々はこのアプローチを2つのベンチマーク手術ビデオデータセットで広範囲に検証した。
論文 参考訳(メタデータ) (2021-03-30T13:20:26Z) - Sequential Recommender via Time-aware Attentive Memory Network [67.26862011527986]
本稿では,注意機構と繰り返し単位を改善するための時間ゲーティング手法を提案する。
また,長期と短期の嗜好を統合するマルチホップ・タイムアウェア・アテンテーティブ・メモリ・ネットワークを提案する。
提案手法は,候補探索タスクに対してスケーラブルであり,ドット積に基づくTop-Kレコメンデーションのための潜在因数分解の非線形一般化とみなすことができる。
論文 参考訳(メタデータ) (2020-05-18T11:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。