論文の概要: Gravity-Aware Hierarchical Routing for Lightweight SensorLLM on Human Activity Recognition
- arxiv url: http://arxiv.org/abs/2606.04019v1
- Date: Mon, 01 Jun 2026 06:43:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.237309
- Title: Gravity-Aware Hierarchical Routing for Lightweight SensorLLM on Human Activity Recognition
- Title(参考訳): 人間活動認識のための軽量センサLLMの重力を考慮した階層的ルーティング
- Authors: Hao Li, Mingrui Zheng, Yasuyuki Tahara, Yuichi Sei,
- Abstract要約: 本報告では,コア手法を強調表示し,より広範な評価を行うための基盤となることを目的として,単一のデータセットにのみ結果を報告する。
センサ言語アライメントに関する最近の研究は、2段階のフレームワークがウェアラブル・センサ・ヒューマン・アクティビティ認識(HAR)のセマンティック・モデリング能力を向上させることを示している。
すでに整列したモデル上に構築された軽量なポストアライメント適応として,重力を考慮した階層型ルーティングヘッドを提案する。
- 参考スコア(独自算出の注目度): 5.363517017074572
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies on sensor-language alignment have shown that two-stage frameworks can improve the semantic modeling ability of wearable-sensor human activity recognition (HAR), where SensorLLM-style methods first perform motion-to-language alignment and then fine-tune the model for downstream tasks. However, our experiments reveal a consistent failure mode when the Stage 2 backbone is compressed to a compact model such as TinyLlama: recognition of dynamic activities remains relatively strong, while the discrimination of low-motion static classes such as standing, sitting, and lying degrades substantially. To address this issue, we propose a gravity-aware hierarchical routing head as a lightweight post-alignment adaptation built on top of an already aligned model, rather than a new large-scale pretraining framework. The method uses the per-channel mean and std from the Chronos tokenizer state to extract statistical cues related to posture and gravity direction, and adaptively combines a static expert and a full expert through soft routing, together with a load-balancing loss for stable training. On the MHealth dataset, this design significantly improves macro-F1 with minimal parameter overhead, and the gains are concentrated mainly on static classes while preserving strong performance on dynamic activities. As a first arXiv disclosure, the current paper reports results on a single dataset only, with the goal of highlighting the core method and laying the groundwork for broader evaluation in future work.
- Abstract(参考訳): センサ言語アライメントの最近の研究は、2段階のフレームワークがウェアラブル・センサ・ヒューマン・アクティビティ認識(HAR)のセマンティック・モデリング能力を向上させることを示している。
しかし,本実験では,TinyLlamaのようなコンパクトなモデルにステージ2のバックボーンを圧縮した場合に一貫した障害モードが明らかとなった。
この問題に対処するために、我々は、新しい大規模事前学習フレームワークではなく、既に整列したモデルの上に構築された軽量なポストアライメント適応として、重力対応階層型ルーティングヘッドを提案する。
この方法は、クロノストークンライザ状態からチャネル平均値とstdを用いて姿勢および重力方向に関する統計的手がかりを抽出し、安定トレーニングのための負荷分散損失とともに、ソフトルーティングを介して静的エキスパートとフルエキスパートを適応的に結合する。
MHealthデータセットでは、パラメータのオーバーヘッドを最小限に抑えたマクロF1が大幅に改善され、ゲインは主に静的クラスに集中し、動的アクティビティの強いパフォーマンスを保っている。
最初のarXiv開示として、本論文では、コアメソッドの強調と、今後の作業における広範な評価の基盤となることを目的として、単一のデータセットのみの結果を報告している。
関連論文リスト
- Position: Weight Space Should Be a First-Class Generative AI Modality [67.10702320971893]
本稿では、モデルチェックポイントを第一級データモダリティとして扱うべきであると論じる。
重み空間における生成的モデリングは、コア機械学習プリミティブとして標準化されるべきである、と論じている。
私たちのゴールは、コミュニティの既定の考え方を、タスクごとのモデルの最適化から、学習した重量分布からモデルのサンプリングにシフトさせることです。
論文 参考訳(メタデータ) (2026-05-18T16:38:26Z) - On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD [93.70725920710208]
ラベル雑音による勾配降下の学習力学について検討する。
遅延からリッチな体制への移行を駆動する上で,ラベルノイズが重要な役割を担っていることを強調する。
これらの知見をSAM(Sharpness-Aware Minimization)に拡張し、ラベルノイズSGDを規定する原理がより広範な最適化アルゴリズムにも適用可能であることを示す。
論文 参考訳(メタデータ) (2026-03-11T04:26:54Z) - MaP: A Unified Framework for Reliable Evaluation of Pre-training Dynamics [72.00014675808228]
大規模言語モデルの不安定性評価プロセスは、真の学習力学を曖昧にする。
textbfMaPは、アンダーラインMergingアンダーラインとアンダーラインPass@kメトリックを統合するフレームワークです。
実験により、MaPはよりスムーズな性能曲線を示し、ラン間分散を低減し、より一貫性のあるランキングを保証する。
論文 参考訳(メタデータ) (2025-10-10T11:40:27Z) - Migration as a Probe: A Generalizable Benchmark Framework for Specialist vs. Generalist Machine-Learned Force Fields [1.572216094651749]
機械学習力場(MLFF)は、分子動力学スケールでのアブ初期レベルの精度を実現することによって、計算材料科学を変革している。
研究者たちは、スペシャリストモデルをスクラッチから訓練するか、ファウンデーショナリストのファンデーションモデルを使うべきか、ハイブリッドアプローチを使うべきか?
本稿では, 弾性バンドトラジェクトリを用いて診断プローブとして評価する, 欠陥マイグレーション経路を用いたベンチマークフレームワークを提案する。
微調整モデルでは、運動特性に対するゼロショットおよびゼロショットのアプローチよりも大幅に優れるが、長距離物理学の部分的な損失を示す。
論文 参考訳(メタデータ) (2025-08-27T13:24:41Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Mamba-FSCIL: Dynamic Adaptation with Selective State Space Model for Few-Shot Class-Incremental Learning [115.79349923044663]
FSCIL(Few-shot class-incremental Learning)は、限られた例から新しいクラスを段階的に学習することを目的としている。
静的アーキテクチャは固定パラメータ空間に依存して、逐次到着するデータから学習し、現在のセッションに過度に適合する傾向がある。
本研究では,FSCILにおける選択状態空間モデル(SSM)の可能性について検討する。
論文 参考訳(メタデータ) (2024-07-08T17:09:39Z) - Exploring Test-Time Adaptation for Object Detection in Continually Changing Environments [20.307151769610087]
連続的テスト時間適応(CTTA)は、目標ドメインを継続的に変更するソーストレーニングモデルに徐々に適応する、有望な手法として登場した。
我々は3つのコアコンポーネントを特徴とするAMRODについて,CTTAシナリオにおける検出モデルに対するこれらの課題に対処する。
我々は,AMRODが既存の方法よりも優れている4つのCTTAオブジェクト検出タスクにおいて,AMRODの有効性を実証する。
論文 参考訳(メタデータ) (2024-06-24T08:30:03Z) - Dynamic Tiling: A Model-Agnostic, Adaptive, Scalable, and
Inference-Data-Centric Approach for Efficient and Accurate Small Object
Detection [3.8332251841430423]
Dynamic Tilingは、小さなオブジェクト検出のためのモデルに依存しない、適応的でスケーラブルなアプローチである。
本手法は, フラグメントオブジェクトを効果的に解決し, 検出精度を向上し, 計算オーバーヘッドを最小限に抑える。
全体として、Dynamic Tilingは既存のモデルに依存しない一様収穫法よりも優れている。
論文 参考訳(メタデータ) (2023-09-20T05:25:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。