論文の概要: Why Meditation Wearables Fail: Reward Misspecification in Closed-Loop EEG and Biofeedback Systems
- arxiv url: http://arxiv.org/abs/2605.28223v1
- Date: Wed, 27 May 2026 09:38:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.938938
- Title: Why Meditation Wearables Fail: Reward Misspecification in Closed-Loop EEG and Biofeedback Systems
- Title(参考訳): 医療用ウェアラブルが機能しない理由:閉鎖型脳波とバイオフィードバックシステムにおける逆方向のミス種別
- Authors: Joy Bose,
- Abstract要約: EEGヘッドバンド、HRVバイオフィードバックデバイス、クローズループ神経刺激システムは基本的な設計上の欠陥を共有している。
彼らは、生成すると主張する結果よりも、測定可能なプロキシシグナルに報いる。
これにより、プロキシミスマッチ、戦略ショートカット、転送失敗の3つの障害モードが生成される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Consumer EEG headbands, HRV biofeedback devices, and closed-loop neurostimulation systems share a fundamental design flaw: they reward measurable proxy signals rather than the outcomes they claim to produce. When a user optimises for calm EEG, HRV coherence, or breathing resonance, their brain learns to produce those signals through whatever strategy is most efficient, including strategies unrelated to the intended benefit. We formalise this as reward misspecification: the policy maximising proxy reward R_proxy is not the policy maximising true intended outcome V_target. This produces three failure modes: proxy mismatch, strategy shortcutting, and transfer failure. We review how existing devices including Muse, HeartMath, Unyte IOM2, and clinical neurofeedback systems instantiate these failures. We introduce a four-tier measurability taxonomy distinguishing reliably measurable wearable targets (Tier 1) from targets that are currently or possibly structurally unmeasurable (Tiers 3 and 4), and show that most devices make implicit Tier 3 and 4 claims. We propose a design framework that avoids all three failure modes: single Tier-1 target (mind-wandering onset via EEG), negative-only cueing, temporal separation of fast EEG and slow somatic feature streams, and transfer to unassisted practice as the only success criterion. No current product meets all four criteria. The framework has direct implications for the design, evaluation, and regulation of cognitive and contemplative wearables.
- Abstract(参考訳): 消費者の脳波ヘッドバンド、HRVバイオフィードバックデバイス、クローズループ神経刺激システムは基本的な設計上の欠陥を共有している。
ユーザーが落ち着いた脳波、HRVコヒーレンス、呼吸共鳴をオプティマイズすると、脳は、意図された利益とは無関係な戦略を含む、最も効率的な戦略を通じてこれらの信号を生成することを学習する。
代行報酬を最大化するポリシー R_proxy は、真の意図した結果を最大化するポリシーではない。
これにより、プロキシミスマッチ、戦略ショートカット、転送失敗の3つの障害モードが生成される。
Muse、HeartMath、Unyte IOM2、臨床神経フィードバックシステムなどの既存のデバイスが、これらの障害をインスタンス化する方法についてレビューする。
測定可能なウェアラブルターゲット(Tier 1)を,現在あるいはおそらく構造的に測定不可能なターゲット(Tiers 3, 4)と区別し,ほとんどのデバイスが暗黙的なTier 3, 4クレームを作成していることを示す。
単一Tier-1ターゲット(EEG経由のミンドワンダリングオンセット)、負のみのキュー、高速な脳波と低速な身体的特徴ストリームの時間的分離、そして唯一の成功基準として無支援の実践への移行という、3つの障害モードをすべて回避する設計フレームワークを提案する。
現在の製品は4つの基準をすべて満たさない。
このフレームワークは、認知的・観念的ウェアラブルの設計、評価、規制に直接的な意味を持っている。
関連論文リスト
- Mechanistic Interpretability of EEG Foundation Models via Sparse Autoencoders [21.680094490174003]
脳波基礎モデルは最先端の臨床成績を達成するが、それらの予測を駆動する内部計算は不透明である。
アーキテクチャ的に異なる3つのEEGトランスにTopKスパースオートエンコーダを適用する。
アーキテクチャ間のモノセマンティリティと絡み合いをベンチマークします。
論文 参考訳(メタデータ) (2026-05-13T16:02:56Z) - PRISM: : Planning and Reasoning with Intent in Simulated Embodied Environments [59.07829883257003]
5つの集合住宅の上に建設され、PRISMは300の人間認証タスクを3つの能力レベルに構成する。
PRISMはエージェントに依存しない実行可能なアクションAPIを公開し、任意のエージェントをエンドツーエンドで評価できるようにする。
論文 参考訳(メタデータ) (2026-05-12T04:59:47Z) - Agentic Adversarial Rewriting Exposes Architectural Vulnerabilities in Black-Box NLP Pipelines [34.37967130277969]
本稿では,意味摂動空間で動作する2エージェント回避フレームワークを提案する。
現代大言語モデル(LLM)ベースのシステムでは、普及率は19.95から40.34%である。
パターンインフォームド・ディフェンスは回避率を65.18%まで下げる。
論文 参考訳(メタデータ) (2026-04-26T00:58:36Z) - Reward Under Attack: Analyzing the Robustness and Hackability of Process Reward Models [68.45272703833209]
現状のPRMは、逆最適化圧力下で体系的に利用可能であることを示す。
これらの脆弱性を定量化するために、敵の圧力を増大させる3段階の診断フレームワークを導入する。
我々は、PRM-BiasBenchと診断ツールキットをリリースし、デプロイ前にロバストネスの評価を可能にする。
論文 参考訳(メタデータ) (2026-02-20T23:38:03Z) - Agentic Uncertainty Quantification [76.94013626702183]
本稿では,言語化された不確実性をアクティブな双方向制御信号に変換する統合されたデュアルプロセスエージェントUQ(AUQ)フレームワークを提案する。
システム1(Uncertainty-Aware Memory, UAM)とシステム2(Uncertainty-Aware Reflection, UAR)は、これらの説明を合理的な手段として利用し、必要な時にのみターゲットの推論時間解決をトリガーする。
論文 参考訳(メタデータ) (2026-01-22T07:16:26Z) - CheXPO-v2: Preference Optimization for Chest X-ray VLMs with Knowledge Graph Consistency [16.21196964897459]
CheXPO-v2は、結果からプロセスの監視に移行するアライメントフレームワークである。
構造化された「障害、関係、解剖学」三つ子に推論ステップを明示的に解析することにより、微妙な監督を提供する。
CheXPO-v2は5kサンプルのみを使用して新しい最先端の精度を実現する。
論文 参考訳(メタデータ) (2025-12-19T03:50:42Z) - MIRAGE: Misleading Retrieval-Augmented Generation via Black-box and Query-agnostic Poisoning Attacks [47.46936341268548]
Retrieval-Augmented Generation (RAG)システムでは、コーパス中毒という致命的な攻撃面が導入されている。
我々は,厳格なブラックボックスとクエリ非依存環境のために設計された,新しい多段階毒素パイプラインであるMIRAGEを提案する。
大規模な実験により、MIRAGEは攻撃効果とステルスネスの両方において既存のベースラインを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2025-12-09T06:38:16Z) - The Dual-use Dilemma in LLMs: Do Empowering Ethical Capacities Make a Degraded Utility? [54.18519360412294]
大きな言語モデル(LLM)は、安全のための有害な要求を拒否することと、ユーティリティのための正当な要求を収容することのバランスをとる必要がある。
本稿では,DPO(Direct Preference Optimization)に基づくアライメントフレームワークを提案する。
我々は,DeepSeek-R1をベンチマークでテストした結果を解析し,この高い評価を得たモデルがもたらす批判的倫理的懸念を明らかにする。
論文 参考訳(メタデータ) (2025-01-20T06:35:01Z) - Refuse Whenever You Feel Unsafe: Improving Safety in LLMs via Decoupled Refusal Training [67.30423823744506]
我々は,LLMに対して,いかなる応答位置においても有害なプロンプトへのコンプライアンスを拒否する権限を付与する,新しいアプローチであるDecoupled Refusal Training(DeRTa)を導入する。
DeRTaは,(1)安全応答の開始に有害な応答のセグメントを付加することにより,安全でないコンテンツの認識と回避をモデルに訓練する,(2)有害応答シーケンスを通して潜在的障害から安全拒絶へ移行する能力をモデルに装備する強化遷移最適化(RTO)という,2つの新しいコンポーネントを組み込んでいる。
論文 参考訳(メタデータ) (2024-07-12T09:36:33Z) - On Minimizing Adversarial Counterfactual Error in Adversarial RL [18.044879441434432]
敵の騒音は、安全クリティカルなシナリオにおいて重大なリスクを生じさせる。
我々は,ACoE(Adversarial Counterfactual Error)と呼ばれる新しい目標を導入する。
本手法は, 対向RL問題に対処するための最先端手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-06-07T08:14:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。