論文の概要: Beyond Hearing: Learning Task-agnostic ExG Representations from Earphones via Physiology-informed Tokenization
- arxiv url: http://arxiv.org/abs/2510.20853v1
- Date: Wed, 22 Oct 2025 05:11:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.269768
- Title: Beyond Hearing: Learning Task-agnostic ExG Representations from Earphones via Physiology-informed Tokenization
- Title(参考訳): 聴覚以外のもの:生理情報化によるイヤホンからのタスク非依存のExG表現の学習
- Authors: Hyungjun Yoon, Seungjoo Lee, Yu Yvonne Wu, Xiaomeng Chen, Taiting Lu, Freddy Yifei Liu, Taeckyung Lee, Hyeongheon Cha, Haochen Zhao, Gaoteng Zhao, Sung-Ju Lee, Cecilia Mascolo, Dongyao Chen, Lili Qiu,
- Abstract要約: スケーラブルでタスクに依存しないExGモニタリングのためのアプローチを野放しに導入する。
提案手法の核心は, 生理的インフォームド・マルチバンド・トークン化(PiMT)であり, ExG信号を12個の生理的インフォームドトークンに分解する。
新しいDailySenseデータセットの実験は、5つの人間の感覚でExGベースの分析を可能にする最初の試みだ。
- 参考スコア(独自算出の注目度): 24.30887065380288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electrophysiological (ExG) signals offer valuable insights into human physiology, yet building foundation models that generalize across everyday tasks remains challenging due to two key limitations: (i) insufficient data diversity, as most ExG recordings are collected in controlled labs with bulky, expensive devices; and (ii) task-specific model designs that require tailored processing (i.e., targeted frequency filters) and architectures, which limit generalization across tasks. To address these challenges, we introduce an approach for scalable, task-agnostic ExG monitoring in the wild. We collected 50 hours of unobtrusive free-living ExG data with an earphone-based hardware prototype to narrow the data diversity gap. At the core of our approach is Physiology-informed Multi-band Tokenization (PiMT), which decomposes ExG signals into 12 physiology-informed tokens, followed by a reconstruction task to learn robust representations. This enables adaptive feature recognition across the full frequency spectrum while capturing task-relevant information. Experiments on our new DailySense dataset-the first to enable ExG-based analysis across five human senses-together with four public ExG benchmarks, demonstrate that PiMT consistently outperforms state-of-the-art methods across diverse tasks.
- Abstract(参考訳): 電気生理学(ExG)信号は、人間の生理学に関する貴重な洞察を提供するが、日常的なタスクをまたいで一般化する基礎モデルを構築することは、2つの重要な制限のために難しいままである。
(i)データ多様性が不十分なため、ほとんどのExG記録は、重厚で高価な装置を備えた管理ラボで収集される。
(II)タスク固有のモデル設計では、タスク間の一般化を制限する調整された処理(すなわち、ターゲット周波数フィルタ)とアーキテクチャを必要とする。
これらの課題に対処するため、我々は、スケーラブルでタスクに依存しないExGモニタリングのアプローチを導入しました。
データ多様性のギャップを狭めるために、イヤフォンベースのハードウェアプロトタイプで50時間の自由生活ExGデータを収集しました。
提案手法の核となるのが,12個の生理的インフォームドトークンにExG信号を分解し,その後に頑健な表現を学習する再構成タスクを施したPiMT(Pysological Informed Multi-band Tokenization)である。
これにより、タスク関連情報をキャプチャしながら、全周波数スペクトルにわたる適応的な特徴認識が可能になる。
新しいDailySenseデータセット(4つの公開ExGベンチマークで5つの人間感覚でExGベースの分析を可能にする最初の実験)では、PiMTがさまざまなタスクにおける最先端メソッドを一貫して上回ることを示した。
関連論文リスト
- SlotFM: A Motion Foundation Model with Slot Attention for Diverse Downstream Tasks [2.0906347671401018]
本稿では,様々な下流タスクを一般化した加速度センサ基礎モデルであるSlotFMを提案する。
我々はSlotFMを、標準的な人間の活動認識を超えた16の分類と回帰ダウンストリームタスクで評価した。
論文 参考訳(メタデータ) (2025-09-25T22:41:43Z) - A Fully Open and Generalizable Foundation Model for Ultrasound Clinical Applications [77.3888788549565]
一般臨床用超音波基礎モデルであるEchoCareについて紹介する。
我々は、キュレートされた、一般公開された大規模なデータセットであるEchoCareData上で、自己教師付き学習を通じてEchoCareを開発した。
最小限のトレーニングで、EchoCareは10の代表的なベンチマークで最先端の比較モデルを上回っている。
論文 参考訳(メタデータ) (2025-09-15T10:05:31Z) - Vision-G1: Towards General Vision Language Reasoning with Multi-Domain Data Curation [64.23194519770897]
8次元にわたる46のデータソースから、総合的なRL対応のビジュアル推論データセットを構築します。
このデータセットから高品質なトレーニングサンプルを識別するために,影響関数に基づくデータ選択と難易度に基づくフィルタリング手法を提案する。
我々はVLM(Vision-G1)をデータカリキュラム付きマルチラウンドRLを用いて訓練し、その視覚的推論能力を反復的に改善する。
論文 参考訳(メタデータ) (2025-08-18T07:24:33Z) - Scaling Wearable Foundation Models [54.93979158708164]
センサ基礎モデルのスケーリング特性を計算,データ,モデルサイズにわたって検討する。
最大4000万時間分の心拍数、心拍変動、心電図活動、加速度計、皮膚温度、および1分間のデータを用いて、私たちはLSMを作成します。
この結果から,LSMのスケーリング法則は,時間とセンサの両面において,計算や外挿などのタスクに対して確立されている。
論文 参考訳(メタデータ) (2024-10-17T15:08:21Z) - PhysMLE: Generalizable and Priors-Inclusive Multi-task Remote Physiological Measurement [24.424510759648072]
本稿では,マルチタスク遠隔生理計測(PhysMLE)のためのローランクエキスパートのエンドツーエンド混合について述べる。
PhysMLEは、新しいルータ機構を持つ複数の低ランクの専門家に基づいており、モデルがタスク内の仕様と相関の両方を十分に扱えるようにしている。
公平かつ包括的な評価のために,マルチソース・シンセマンティック・ドメイン・ジェネリゼーション・プロトコルと呼ばれる大規模マルチタスク・ジェネリゼーション・ベンチマークを提案する。
論文 参考訳(メタデータ) (2024-05-10T02:36:54Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Self-supervised transfer learning of physiological representations from
free-living wearable data [12.863826659440026]
意味ラベルのない活動・心拍(HR)信号を用いた新しい自己教師型表現学習法を提案する。
我々は、我々のモデルを、最大の自由生活複合センシングデータセット(手首加速度計とウェアラブル心電図データによる280k時間)で評価する。
論文 参考訳(メタデータ) (2020-11-18T23:21:34Z) - Learning Generalizable Physiological Representations from Large-scale
Wearable Data [12.863826659440026]
意味ラベルのない活動・心拍(HR)信号を用いた新しい自己教師型表現学習法を提案する。
その結果, 線形分類器を用いた伝達学習により, 様々な下流タスクにおいて, 埋め込みが一般化できることが示唆された。
本研究は,大規模健康・ライフスタイルモニタリングに寄与する行動・生理的データに対する,最初のマルチモーダル自己管理手法を提案する。
論文 参考訳(メタデータ) (2020-11-09T17:56:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。