論文の概要: Latent Structure of Affective Representations in Large Language Models
- arxiv url: http://arxiv.org/abs/2604.07382v1
- Date: Wed, 08 Apr 2026 02:13:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.431168
- Title: Latent Structure of Affective Representations in Large Language Models
- Title(参考訳): 大規模言語モデルにおける影響表現の潜在構造
- Authors: Benjamin J. Choi, Melanie Weber,
- Abstract要約: 大規模言語モデル(LLM)における感情表現の潜時構造を幾何学的データ解析ツールを用いて検討する。
まず, LLMは, 感情的感情のコヒーレントな潜在表現を学習し, 感情的感情を心理学的モデルから学習することを示す。
第二に、これらの表現は、しかしながら線形に十分に近似できる非線形幾何学的構造を示す。
第三に、学習した潜在表現空間を利用して感情処理タスクの不確かさを定量化できることを実証する。
- 参考スコア(独自算出の注目度): 6.345340156849189
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The geometric structure of latent representations in large language models (LLMs) is an active area of research, driven in part by its implications for model transparency and AI safety. Existing literature has focused mainly on general geometric and topological properties of the learnt representations, but due to a lack of ground-truth latent geometry, validating the findings of such approaches is challenging. Emotion processing provides an intriguing testbed for probing representational geometry, as emotions exhibit both categorical organization and continuous affective dimensions, which are well-established in the psychology literature. Moreover, understanding such representations carries safety relevance. In this work, we investigate the latent structure of affective representations in LLMs using geometric data analysis tools. We present three main findings. First, we show that LLMs learn coherent latent representations of affective emotions that align with widely used valence--arousal models from psychology. Second, we find that these representations exhibit nonlinear geometric structure that can nonetheless be well-approximated linearly, providing empirical support for the linear representation hypothesis commonly assumed in model transparency methods. Third, we demonstrate that the learned latent representation space can be leveraged to quantify uncertainty in emotion processing tasks. Our findings suggest that LLMs acquire affective representations with geometric structure paralleling established models of human emotion, with practical implications for model interpretability and safety.
- Abstract(参考訳): 大規模言語モデル(LLM)における潜在表現の幾何学的構造は、その一部がモデルの透明性とAI安全性に影響を及ぼすために、活発な研究領域である。
既存の文献は、学習した表現の一般的な幾何学的および位相的特性に主に焦点を合わせてきたが、地道な潜在幾何学が欠如しているため、そのような手法の発見を検証することは困難である。
感情処理は、心理学の文献でよく確立されている分類的組織と連続的な感情的次元の両方を示す感情として、表現幾何学を探求するための興味深いテストベッドを提供する。
さらに、そのような表現を理解することは、安全性を損なう。
本研究では,LLMにおける感情表現の潜時構造を幾何学的データ解析ツールを用いて検討する。
主な所見は3つである。
まず, LLMは, 感情的感情のコヒーレントな潜在表現を学習し, 感情的感情を心理学的モデルから学習することを示す。
第二に、これらの表現は、しかしながら線形に十分に近似できる非線形幾何学的構造を示しており、モデル透過法で一般的に仮定される線形表現仮説に対する実証的な支持を提供する。
第三に、学習した潜在表現空間を利用して感情処理タスクの不確かさを定量化できることを実証する。
以上の結果から,LLMは人間の感情のモデルと平行する幾何学的構造を持つ感情表現を習得し,モデル解釈可能性と安全性に実際的意味があることが示唆された。
関連論文リスト
- Emergent Structured Representations Support Flexible In-Context Inference in Large Language Models [77.98801218316505]
大型言語モデル(LLM)は、人間のような推論を示唆する創発的な行動を示す。
テキスト内概念推論におけるLLMの内部処理について検討する。
論文 参考訳(メタデータ) (2026-02-08T03:14:39Z) - Are Emotions Arranged in a Circle? Geometric Analysis of Emotion Representations via Hyperspherical Contrastive Learning [18.807120508172407]
本稿では,ハイパースフィア上でのコントラスト学習を通じて,言語モデル埋め込み内の円形感情表現を誘導する手法を提案する。
この円形アライメントは次元減少に対して優れた解釈性と頑健性を提供するが、高次元設定やきめ細かな分類における従来の設計に比べて性能が劣ることを示す。
論文 参考訳(メタデータ) (2026-01-10T13:54:06Z) - Seeing through Imagination: Learning Scene Geometry via Implicit Spatial World Modeling [68.14113731953971]
本稿では,人間のような想像力をシミュレートするインプリシット・スパットIaLwOrldモデリングパラダイムMILOを紹介する。
提案手法は,複数のベースラインとベンチマークにまたがる空間推論能力を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2025-12-01T16:01:41Z) - The Shape of Adversarial Influence: Characterizing LLM Latent Spaces with Persistent Homology [4.280045926995889]
本研究では,大規模言語モデルの内部表現空間に対して,逆入力が体系的にどう影響するかに着目した。
アクティベーションの形状と神経情報の流れを定量化することにより、アーキテクチャに依存しない枠組みは、表現的変化の基本的な不変性を明らかにする。
論文 参考訳(メタデータ) (2025-05-26T18:31:49Z) - MATHGLANCE: Multimodal Large Language Models Do Not Know Where to Look in Mathematical Diagrams [65.02628814094639]
ダイアグラムは視覚言語の基本形として機能し、複雑な概念と、構造化されたシンボル、形状、空間的配置を通してそれらの相互関係を表現する。
現在のベンチマークでは知覚と推論のタスクが明確化されており、マルチモーダルな大規模言語モデルが表面的なパターン認識以上の数学的図形を真に理解しているかどうかを評価することは困難である。
MLLMにおける数学的知覚の分離と評価を目的としたベンチマークであるMATHGLANCEを紹介する。
幾何学的プリミティブと正確な空間関係を付加した200K構造幾何画像テキストの知覚指向データセットであるGeoPePを構築した。
論文 参考訳(メタデータ) (2025-03-26T17:30:41Z) - Learning Visual-Semantic Subspace Representations [49.17165360280794]
我々は,自己教師型学習に有効な情報理論の原理を基礎として,核ノルムに基づく損失関数を導入する。
この損失の理論的特徴として、クラス性の促進に加えて、部分空間格子内のデータのスペクトル幾何学を符号化していることを示す。
論文 参考訳(メタデータ) (2024-05-25T12:51:38Z) - Using Shapley interactions to understand how models use structure [9.93791871599425]
我々は、Shapley Taylorインタラクション指標(STII)を用いて、言語モデルと音声モデルが内部的にどのように関係し、その入力を構造化するかを調べる。
モデル内の相互作用パターンを,構文構造,非構成的意味論,音声的協調という3つの基礎的言語構造に関連付ける。
論文 参考訳(メタデータ) (2024-03-19T19:13:22Z) - Analyzing the Representational Geometry of Acoustic Word Embeddings [22.677210029168588]
音響単語埋め込み(AWEs)は、同じ単語の異なる音響例が近傍に投影されるようなベクトル表現である。
本稿では、英語の音声から学んだAWEを分析分析し、学習対象とアーキテクチャの選択がどのように表現プロファイルを形作るかを検討する。
論文 参考訳(メタデータ) (2023-01-08T10:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。