論文の概要: A Shared Valence Axis Across Modern LLMs and Human EEG: The Saturation Regularity
- arxiv url: http://arxiv.org/abs/2606.00129v1
- Date: Thu, 28 May 2026 19:42:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:27.986406
- Title: A Shared Valence Axis Across Modern LLMs and Human EEG: The Saturation Regularity
- Title(参考訳): 現代LLMとヒト脳波の共通原子価軸:飽和規則性
- Authors: Yousef A. Radwan, Xuhui Liu, Kilichbek Haydarov, Yuqian Fu, Mohamed Elhoseiny,
- Abstract要約: 大規模言語モデル(LLM)は、人間の認知と内部的特徴がますます一致している強力な表現学習者として登場した。
我々は、現代のLLMが人間の脳内の神経表現を理解するためのレンズとして機能するかどうかを考察する。
- 参考スコア(独自算出の注目度): 45.39795199208249
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have emerged as powerful representation learners whose internal features increasingly align with human cognition. We study whether modern LLMs can serve as a lens for understanding neural representations in the human brain, focusing on emotional valence in EEG. We first build a one-dimensional valence direction, the V-axis, from modern LLMs using only nine emotion-evocative sentences. We validate it through zero-shot transfer to sentiment benchmarks and cross-model consistency across fourteen LLMs. We then show that this LLM-derived direction maps onto human neural activity. On a public EEG cohort of 123 subjects watching affective videos, a single linear projection on EEG features tracks the V-axis position of each stimulus. Moreover, 36 EEG emotion classifiers trained without exposure to the V-axis spontaneously rediscover the same direction in their internal representations, suggesting that the same valence structure emerges in both language models and human electrophysiology. Yet this convergence does not provide an effective training signal. We test twenty-five alignment strategies, including knowledge distillation, representational similarity, contrastive, and topographic losses; none improve decoding, and sixteen significantly reduce accuracy. We formalize this result as the saturation regularity: once task labels alone drive a brain-decoding network onto the target direction, additional supervision mainly distorts an already-saturated basin, while the load-bearing within-class residual receives little useful gradient. This regularity also indicates where improvement should come from: the residual subspace unreachable by supervision. Motivated by this insight, we ensemble across residual diversity rather than supervising the basin, improving balanced accuracy by 10.5% over the prior best on FACED, with the same effect replicated on SEED-V.
- Abstract(参考訳): 大きな言語モデル(LLM)は、人間の認知と内部的特徴がますます一致している強力な表現学習者として出現している。
脳波の感情価に焦点をあて,人間の脳内の神経表現を理解するためのレンズとして,現代のLLMが有効であるかどうかを検討した。
我々はまず,9つの感情刺激文のみを用いて,現代のLLMから1次元価方向であるV軸を構築した。
感傷的ベンチマークへのゼロショット転送と14LLM間のクロスモデル整合性による検証を行った。
次に、このLSM由来の方向が人間の神経活動にマッピングされることを示す。
感情ビデオを見ている123人の公的な脳波コホートでは、脳波の特徴の1つの直線投影が各刺激のV軸位置を追跡する。
さらに、V軸に曝さないように訓練された36個の脳波感情分類器は、内部表現の同じ方向を自発的に再発見し、同じ原子価構造が言語モデルと人間の電気生理学的の両方に現れることを示唆している。
しかし、この収束は効果的な訓練信号を提供しない。
我々は, 知識蒸留, 表現類似性, コントラスト, 地形損失を含む25のアライメント戦略を検証し, 復号化は改善せず, 精度は16。
タスクラベルだけでブレインデコードネットワークを目標方向に駆動すると、追加の監督は、既に飽和している盆地を主に歪ませる一方、クラス内残留物は、ほとんど有用な勾配を受け取らない。
この規則性はまた、改善がどこから来るべきかを示している。
この知見に動機づけられた我々は、盆地を監督するのではなく、残留する多様性にまたがり、以前のFACEDよりも10.5%の精度でバランスを保ち、SEED-Vで同じ効果を再現した。
関連論文リスト
- Brain alignment of reasoning and action representations from vision-language and action models during naturalistic gameplay [40.44107959566121]
fMRI記録を用いた2つの基礎モデル群からの代表モデルの脳内アライメントについて検討した。
視覚言語モデル (VLM) と大動作モデル (LAM) の両方で, ボクセルエンコーディング性能が著しく向上していることが判明した。
論文 参考訳(メタデータ) (2026-05-19T04:40:14Z) - Negative Before Positive: Asymmetric Valence Processing in Large Language Models [0.0]
本研究では,大規模言語モデル (LLM) が内部構造や表面トークンマッチングを通じて感情価を処理しているかを検討する。
負の結果は初期層に局在し、正の結果は中期から後期層にピークとなる。
論文 参考訳(メタデータ) (2026-05-07T04:09:11Z) - Valence-Arousal Subspace in LLMs: Circular Emotion Geometry and Multi-Behavioral Control [25.46699328296852]
感情ステアリングベクターを導出し、VA軸を上位PCA成分の線形結合として学習する。
VAサブスペースは、人間の感情知覚の確立したモデルと整合した円形の幾何学を示す。
論文 参考訳(メタデータ) (2026-04-03T16:08:05Z) - Self-Correction Inside the Model: Leveraging Layer Attention to Mitigate Hallucinations in Large Vision Language Models [0.0]
内部自己補正機構は、生成中に隠れた状態を直接操作する。
LLaVA1.5-7BとQwen2.5-VL-7Bの0.2Mと0.1Mの追加パラメータの導入とトレーニングにより、複数の幻覚ベンチマークの視覚的グラウンド化が一貫して改善される。
論文 参考訳(メタデータ) (2026-02-28T03:33:12Z) - E^2-LLM: Bridging Neural Signals and Interpretable Affective Analysis [54.763420895859035]
脳波からの感情分析のための最初のMLLMフレームワークであるELLM2-EEG-to-Emotion Large Language Modelを提案する。
ELLMは学習可能なプロジェクション層を通じて、トレーニング済みのEEGエンコーダとQベースのLLMを統合し、マルチステージのトレーニングパイプラインを使用する。
7つの感情カテゴリーにまたがるデータセット実験により, ELLM2-EEG-to-Emotion Large Language Modelは感情分類において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2026-01-11T13:21:20Z) - Revealing Perception and Generation Dynamics in LVLMs: Mitigating Hallucinations via Validated Dominance Correction [59.801614364841775]
LVLM(Large Vision-Language Models)は目覚ましい能力を示しているが、幻覚は依然として持続的な課題である。
本研究は,LVLMにおける視覚知覚とトークン生成の内部進化の系統的解析である。
我々は,VDC(d Dominance Correction)戦略を考案し,不要なトークンを検出し,検証済みトークンに置き換えて出力信頼性を向上させる。
論文 参考訳(メタデータ) (2025-12-21T17:05:42Z) - Structured Contrastive Learning for Interpretable Latent Representations [2.8870482999983094]
本研究では,潜在空間表現を3つの意味群に分割するフレームワークであるStructured Contrastive Learning (SCL)を提案する。
ECG相の分散とIMU回転の実験は優れた性能を示した。
この研究は、リアクティブデータ拡張からプロアクティブな構造学習へのパラダイムシフトを表し、ニューラルネットワークにおける解釈可能な潜在表現を可能にする。
論文 参考訳(メタデータ) (2025-11-18T21:18:20Z) - GrAInS: Gradient-based Attribution for Inference-Time Steering of LLMs and VLMs [56.93583799109029]
GrAInSは推論時ステアリングのアプローチで、言語のみのモデルと視覚言語の両方のモデルとタスクで動作する。
推論中、GrAInSはトークンレベルの属性信号によって誘導されるトランスフォーマー層で隠されたアクティベーションを隠蔽し、アクティベーションを正規化し、表現スケールを保存する。
微調整と既存のステアリングベースラインの両方を一貫して上回る。
論文 参考訳(メタデータ) (2025-07-24T02:34:13Z) - Factual Self-Awareness in Language Models: Representation, Robustness, and Scaling [56.26834106704781]
大規模言語モデル(LLM)のユビキタス展開における主要な関心事の一つは、生成されたコンテンツの事実的誤りである。
我々は, LLMの内部コンパスの存在を裏付ける証拠を提供し, 生成時の事実的リコールの正しさを規定する。
モデルサイズにわたる実験のスケールとトレーニングのダイナミクスは、トレーニング中に自己認識が急速に出現し、中間層でピークとなることを浮き彫りにしている。
論文 参考訳(メタデータ) (2025-05-27T16:24:02Z) - Hybrid Discriminative-Generative Training via Contrastive Learning [96.56164427726203]
エネルギーベースモデルのハイブリッド識別・生成訓練の観点から、コントラスト学習と教師あり学習の直接的な関連性を示す。
CIFAR-10 および CIFAR-100 上の WideResNet の分類精度において,エネルギーベース損失の近似の具体的な選択が既存手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-07-17T15:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。