論文の概要: LastAct: Trajectory-Guided Latest-Activity Localization for Real-Time Smart-Home Activity Recognition
- arxiv url: http://arxiv.org/abs/2606.00260v2
- Date: Wed, 03 Jun 2026 00:30:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 17:40:41.572299
- Title: LastAct: Trajectory-Guided Latest-Activity Localization for Real-Time Smart-Home Activity Recognition
- Title(参考訳): LastAct: リアルタイムスマートホーム活動認識のためのトラジェクトリガイドによる最新のアクティブローカライゼーション
- Authors: Zishuai Liu, Ruili Fang, Jin Lu, Fei Dou,
- Abstract要約: 環境センサからのヒューマンアクティビティ認識(HAR)は、健康モニタリングや生活支援といったスマートホームアプリケーションを可能にする。
スライディング・ウインドウ推論は、遷移を成し、混合活動を含む多くのウィンドウを生成する。
我々は、スマートホームHARをストリーミングするためのトラジェクトリ中心のフレームワークであるLastActを紹介した。
- 参考スコア(独自算出の注目度): 4.17314890656811
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human Activity Recognition (HAR) from ambient sensors enables smart-home applications such as health monitoring and assisted living. In realistic deployments, however, sensor events arrive as a continuous stream and activity boundaries are unknown. Sliding-window inference therefore produces many windows that straddle transitions and contain mixed activities, creating boundary contamination that violates the pre-segmented instance assumption used by most benchmarks and models. Moreover, many pipelines under-use spatial context by treating sensor IDs as independent tokens. We present LastAct, a trajectory-centric framework for streaming smart-home HAR that targets the most recent activity under mixed windows while explicitly modeling spatial structure. LastAct projects sensor events onto the home floorplan to form a layout-aligned trajectory image sequence that preserves spatial continuity. A lightweight gate identifies contaminated windows, and a boundary localizer estimates the last transition to enable boundary-guided masking that emphasizes post-boundary evidence and suppresses stale context. For efficiency, we reuse a precomputed layout-aligned template cache to avoid repeated rendering. Empirically, across four public smart-home datasets under near-realistic mixed-activity protocols, LastAct achieves competitive or superior performance on pure windows and yields substantial Macro-F1 gains on cross/mixed windows, demonstrating improved robustness under near-realistic sliding-window regimes.
- Abstract(参考訳): 環境センサからのヒューマンアクティビティ認識(HAR)は、健康モニタリングや生活支援といったスマートホームアプリケーションを可能にする。
しかし、現実的なデプロイメントでは、継続的なストリームとアクティビティ境界が不明なため、センサイベントがやってくる。
したがって、スライディング・ウインドウの推論は多くのウィンドウを生成し、遷移が重なり混在し、多くのベンチマークやモデルで使われる事前のインスタンス仮定に反する境界汚染を発生させる。
さらに、センサIDを独立したトークンとして扱うことにより、多くのパイプラインが空間的コンテキストで使用される。
我々は、空間構造を明示的にモデル化しながら、混合ウィンドウ下での最新のアクティビティをターゲットとしたスマートホームHARをストリーミングするためのトラジェクトリ中心のフレームワークであるLastActを提案する。
LastActは、センサイベントをホームフロアプランに投影し、空間連続性を保存するレイアウト整列軌道画像シーケンスを形成する。
ライトウェイトゲートは汚染された窓を識別し、境界ローカライザは境界誘導マスキングを可能にする最後の遷移を推定する。
効率性のために、繰り返しレンダリングを避けるために、事前計算されたレイアウト整列テンプレートキャッシュを再利用する。
実証的には、ほぼ現実的な混合アクティビティプロトコルの下で4つのパブリックなスマートホームデータセットにわたって、LastActは純粋なウィンドウ上での競合あるいは優れたパフォーマンスを実現し、クロス/ミックスウィンドウでかなりのMacro-F1ゲインを獲得し、ほぼ現実的なスライディングウィンドウ体制下での堅牢性の向上を実証している。
関連論文リスト
- EventGait: Towards Robust Gait Recognition with Event Streams [50.890621860023]
イベントカメラは、マイクロ秒時間分解能と高ダイナミックレンジを提供し、自然にロバストなダイナミックキューをキャプチャし、静的ノイズを抑制する。
イベントの利点を保ちながら、動きと形状を別々にモデル化する、エンドツーエンドのデュアルストリームフレームワークである textbfEventGait を提案する。
当社のアプローチでは,イベント駆動歩行分析の堅牢性と可能性を強調し,合成および実世界の歩行ベンチマークに新たな技術状況が設定されている。
論文 参考訳(メタデータ) (2026-05-21T08:12:04Z) - LEAR: Learning Edge-Aware Representations for Event-to-LiDAR Localization [15.308350522323588]
LEARは、エッジ構造と高密度事象深度流れ場を共同で推定し、知覚とモダリティの分断を橋渡しする。
いくつかの人気があり、挑戦的なデータセットにおいて、LEARは最高の先行メソッドよりも優れたパフォーマンスを達成している。
論文 参考訳(メタデータ) (2026-03-02T13:18:25Z) - MARAuder's Map: Motion-Aware Real-time Activity Recognition with Layout-Based Trajectories [3.788163163289351]
本稿では,未分割のセンサストリームからリアルタイムなアクティビティ認識のための新しいフレームワークを提案する。
提案手法は,センサアクティベーションを物理フロアプラン上に提案し,軌跡認識画像のようなシーケンスを生成する。
時間的意識を高めるために,文脈的手がかりをエンコードする学習可能な時間埋め込みモジュールを導入する。
論文 参考訳(メタデータ) (2025-11-08T00:07:43Z) - Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - StreamAgent: Towards Anticipatory Agents for Streaming Video Understanding [52.55809460075286]
本稿では,今後のタスク関連情報を含むと思われる時間間隔と空間領域を予測できるStreamAgentを提案する。
我々は,重要な出来事の時間的進行を予測するために,予測エージェントに期待を促すことによって,質問の意味論と歴史的観察を統合する。
提案手法は,応答精度とリアルタイム効率において既存の手法よりも優れており,実世界のストリーミングシナリオの実用的価値を強調している。
論文 参考訳(メタデータ) (2025-08-03T18:15:42Z) - Inference-Time Gaze Refinement for Micro-Expression Recognition: Enhancing Event-Based Eye Tracking with Motion-Aware Post-Processing [2.5465367830324905]
イベントベースの視線追跡は、きめ細かい認知状態の推測に重要な可能性を秘めている。
本稿では、既存の事象に基づく視線推定モデルの出力を高めるために、モデルに依存しない推論時間改善フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-14T14:48:11Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - Transparent Object Tracking with Enhanced Fusion Module [56.403878717170784]
我々は,我々の融合技術を用いて,透明物体追跡のための優れた結果を得る新しいトラッカーアーキテクチャを提案する。
我々の結果とコードの実装はhttps://github.com/kalyan05TOTEM.comで公開されます。
論文 参考訳(メタデータ) (2023-09-13T03:52:09Z) - Propagate And Calibrate: Real-time Passive Non-line-of-sight Tracking [84.38335117043907]
本研究では,リレー壁のみを観察することで,見えない部屋を歩いている人を追跡する純粋受動的手法を提案する。
本研究では,リレー壁の映像の非知覚的変化を発掘するため,時間的局所的な動きの伝達に欠かせない特徴として差分フレームを導入する。
提案手法を評価するため,最初の動的受動NLOS追跡データセットであるNLOS-Trackを構築し,公開する。
論文 参考訳(メタデータ) (2023-03-21T12:18:57Z) - Multimodal Generation of Novel Action Appearances for Synthetic-to-Real
Recognition of Activities of Daily Living [25.04517296731092]
外見の変化のようなドメインシフトは、アクティビティ認識モデルの現実的な応用において重要な課題である。
本稿では,既存の活動モダリティから新たなADLの出現を生成するアクティビティドメイン生成フレームワークを提案する。
本フレームワークは,人間のポーズ,体継手のヒートマップ,光フローマップを計算し,元のRGBビデオと併用してソースドメインの本質を学習する。
論文 参考訳(メタデータ) (2022-08-03T08:28:33Z) - A Tree-structure Convolutional Neural Network for Temporal Features
Exaction on Sensor-based Multi-resident Activity Recognition [4.619245607612873]
マルチレジデント活動認識(TSC-MRAR)のためのエンドツーエンド木構造畳み込みニューラルネットワークフレームワークを提案する。
まず、各サンプルをイベントとして扱い、スライディングウインドウに過去のセンサの読み取りを埋め込んだ現在のイベントを得る。
そして、時間的特徴を自動的に生成するために、木構造ネットワークを設計し、近くの読み物の時間的依存を導出する。
論文 参考訳(メタデータ) (2020-11-05T14:31:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。